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(54) Title: NOVEL TRANSCRIPTION FACTOR CPCRl FOR REGULATION OF ISOPENICILLIN N SYNTHETASE GENE (PCbC) 
AND AC/ACV SYNTHESASE GENE (pcbAB) 

(54) Bczeichnung: NEUER TRANSKRIPTIONSFAKTOR CPCRI ZUR REGULATION DES ISOPENICILLIN 

N-SYNTHETASE-GENS (PCbC) UND DES AC-/ACV-SYNTHETASE-GENS (pcbAB) 

(57) Abstract 

The invention relates to a 
DNA binding protein which binds 
to double-strand DNA of sequence 
GTTGCCGGGCCAATCCCTGAGCTT 
from the intergenic region of the 
pcbAB and pcbC gene of acremonium 
chrysogenum as a monomer, homodimer 
or part of a heterodimer. Said protein 
can affect the transcription of the pcbAB 
and/or pcbC gene and is especially 
characterised in that it contains the 
amino acid sequence of the CRCRl 
protein according to table 7, The 
invention also relates to fusion proteins 
containing the amino acid sequence of 
the CPCRl protein or parts thereof and 
a transactivation domain. The invention 
further relates to DNA coding for the 
known proteins, vectors containing said 

DNA, host cells containing DNA and/or said vectors,a method for the production of the DNA binding protcin.and a method for increasing 
cephalosporin C yield in acremonium chrysogenum. The invention also relates to DNA binding points for the inventive DNA binding 
protein. 



BSli 



BSIIml 



BSiimZ 



BSIIm3 



GTT6CCG6CCCAXTCCCTGA6CTT 
C|g^GfiCC£6i2XXAG6GACTC6AA 

6TTGCCGG66CXTACCCTGAGCTT 
CAACGGCCCCCMXGGGACTCGAA 

GTTGCCGGGCCTATCCCTGAGCTT 
CAACGGCCCGCXTAGGGACICGAA 

CAACCCG6GCCAATCCCTGAGCTT 
6STG6GCCCGGTTA6G6ACTC6AA 



p^N u B-6al 



603 +/- m 



9.0 +/- 2,5 



140+/- 62 



5,7+/- 2.0 
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(57) Zusammenfassung 

Die Erfindung betrifft ein DNA-bindendes Protein, welches als Monomer, Homodimer oder Teil eincs Heterodimer an doppelstrangige 
DNA dcr Scqucnz GTTGCCGGGCCAATCCCTGAGCTT aus dem inlergcnischen Bercich des pcbAB und pcbG-Gens von Acremonium 
chrysogenum bindet und in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu beeinflussen, insbesondere dadurch 
gckennzcichnet, daB es die AminosSurescquenz des CPCRl -Proteins gemSB Tab. 7 enthSlt. Des weiteren betrifft die Erfindung 
Fusionsprotcine, enthaliend die AminosSuresequenz des cpcRl -Proteins oder Teile davon und eine Transaktivierungsdom9ne. Die Erfindung 
betrifft ebenfalls fQr die genannien Proteine kodierende DNA, Vektorcn enthaliend diesc DNA. Wirtszellen enthaltend die DNA und/oder 
die Vcktoicn, cin Verfahrcn zur Herstellung des DNA-bindendcn Proteins, ein Verfahren zur Steigerung der Cephalosporin C-Ausbeute in 
Acremonium chrysogenum, AuBerdem betrifft die Erfindung die DNA-Bindungsstellen fur das erfindungsgemSBe DNA-bindende Protein. 
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Neuer Transkriptionsfaktor CPCR1 zur Regulation des Isopenicillin N-Synthetase- 
Gens (pcbC) und des AC-/ACV-Synthetase-Gens (pcbAB) 

Die Erfindung betrifft ein DNA bindendes Protein, welches an doppelstrangige DNA 
der Sequenz GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO.: 4) aus dem 
intergenischen Bereich des pcbAB und pcbC-Gens von Acremonium chrysogenum 
bindet und in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu 
beeinflussen. 

1 . Regulation der Genexpression mittels Transkriptionsfaktoren bei Pilzen 

Die Genexpresssion wird u. a. uber die Haufigkeit der Transkriptionsinitiation 
reguliert. Das Vorhandensein von sogenannten Transkriptionsfaktoren kann dabei 
einen positiven Oder einen negativen EinfluS haben. Transkriptionsfaktoren sind 
frans-wirkende DNA-Bindeproteine, die zum Beispiel an DNA-Elemente innerhalb 
der regulatorischen Sequenzen eines Gens binden konnen. Die Spezifitat der DNA- 
Protein-lnteraktion wird durch Kontakte zwischen den beteiligten Nukleotlden, bzw. 
dem DNA-Ruckgrad und den Aminosauren und ihren Seitenketten erreicht 
(Zusammenfassung bei Pabo und Sauer 1992). 

Transkriptionsfaktoren werden nach den strukturellen Eigenschaften ihrer DNA- 
Bindedomanen in verschiedenen Klassen eingeteilt. So kennt man.zum Beispiel 
Helix-Turn-Helix-, Homeodomain-, Zinkfinger Oder auch Leucin-Zipper-Proteine 
(Zusammenfassung bei Pabo und Sauer 1992). Die meisten Klassen von 
Transkriptionsfaktoren wurden auch bei Hyphenpilzen entdeckt und 
charakteristische Beispiele werden in Tabelle 1 genannt. Insgesamt wurden etwa 50 
Transkriptionsfaktoren von Hyphenpilzen molekular charakterisiert. Mit circa 20 
klonierten Transkriptionsfaktoren gehort Aspergillus nidulans unter den 
Hyphenpilzen zu den Organismen, uber deren transkriptionelle Regulation der 
Genexpression am meisten bekannt ist. Bei Neurospora crassa liegen detaillierte 
Kenntnisse zum Beispiel uber die Regulation der Gene fur die Verwertung von Nitrat 



9931244A1_I_> 



wo 99/3 J 244 



PCT/EP98/0'7971 



2 

zur Deckung des Stickstoffbedarfs vor (Marzluff 1993). Das nit-3 Gen kodiert fur die 
Nitratreduktase und stellt das erste Gen des Stoffwechselweges fur die 
Nitratassimilation dar. Die Expression dieses Gens wird von zwei regulatorischen 
Proteinen (N1T2 und NIT4) gesteuert. Wobei es sich bei NIT2 urn ein allgemeines 
regulatorisches Protein und bei NIT4 urn einen Stoffwechselweg-spezifischen 
Transkriptionsfaktor handelt (Chiang und Marzluff 1995). NIT4 gehort zur Klasse der 
Zn(ll)2Cys6-Zinkfingerproteine, die bislang nur bei Pilzen gefunden wurden 
(Schjerling und Holmberg 1996). Ein anderes sehr gut analyslertes Beispiel dieser 
Klasse ist das GAL4-Protein der Hefe Saccharomyces cerevisiae. 
Aus dem (3-Lactam-Produzenten Acremonium chrysogenum wurden bisher keine 
Transkriptionsfaktoren isoliert. Es wurden lediglich biochemische 
Charakterisierungen von DNA-Bindeproteinen vorgenommen, die mit Cephalosporin 
C-Biosynthese-Genen in Wechselwirkung treten (Radzio 1996. Then Bergh et al. 
1996). 

2. Produktion von p-Lactamantibiotika durch Mikroorgantsmen 

Die p-Lactame sind seit der Entdeckung des Penicillins durch Alexander Fleming im 
Jahre 1 929 eine der erfolgreichsten Wirkstoffgruppen mit antibakterieller Potenz. 
Ursprunglich als eine Kontamination auf einer Petrischale mit Staphylococcen 
aufgrund seiner wachstumshemmenden Eigenschaften entdeckt, konnte der Pilz 
Penicillium notatum zur ersten biotechnologischen Produktion eines Medikamentes 
genutzt werden. Chain und Florey isolierten 1940 den Wirkstoff Penicillin und 
setzten ihn klinisch ein. Das chemische Grundgerust der Penicilline, die 6- 
Aminopenicillansaure (6-APA). kann verschiedene Substituenten tragen, was die 
groBe Vielfalt der p-Lactame bedingt, Penicilline zeigen sich auBerst wirksam gegen 
Gram-positive Bakterien wie Staphylococcus aureus. Allerdings haben viele 
Bakterienstamme im Laufe der Zeit Resistenzen entwickelt. 

Bei der Entwicklung neuer Penicillin-Derivale wurden z.B. halbsynthetische 
Antibiotika eingesetzt, bei denen eine fermentativ produzierte Vorstufe, das 
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Penicillin G, chemisch oder enzymatisch zu 6-APA umgesetzt wird. Diese kann 
anschlieBend zu den Wirksubstanzen weiterverarbeitet werden. Zum anderen 
wurde schon fruhzeitig damit begonnen, nach weiteren naturlichen p-Lactamen zu 
suchen. 

1953 konnte aus dem Kulturfiltrat des Hyphenpilzes Acremonium chrysogenum 
(syn. Cephalospohum acremonium) neben dem bereits bekannten Penicillin N eine 
weitere p-Lactam-Stammverbindung, das Cephalosporin C isoliert werden. A. 
chrysogenum zShlt wie Penicillium chrysogenum zu den filamentds wachsenden 
Pilzen, die sich morphologisch deutlich von Hefen oder einzelligen Bakterien 
abgrenzen lassen. 

Cephalosporine unterscheiden sich von den Penicillinen durch ein modifiziertes 
GrundgerCist. Sie werden im Gegensatz zu den Penicillinen aulJer von Hyphenpilzen 
auch von Bakterien synthetitisert. 

Ahnlich wie bei den Penicillinen werden in der Pharmakologie im wesentlichen 
halbsynthetische Cephalosporine eingesetzt. die ausgehend von der 7- 
Aminocephalosporansaure (7-ACS) synthetisiert werden. Die heute verwendete 
"dritte Generation" der Cephalosporine zeichnet sich durch ein breites 
Aktivitatsspektrum auch gegen Gram-negative Bakterien, von denen viele 
Resistenzen gegen Antibiotika zeigen, geringe Humantoxizitat und gute Stabilitat 
gegen bakterielle p-Lactamasen aus. A. chrysogenum ist bis heute der wichtigste 
Produzent der entsprechenden Vorstufen. Der Biosyntheseweg und die Sulieren 
Faktoren, die auf die Synthese wirken, sind im Prinzip bekannt. Durch 
konventionelle Mutagenseverfahren und Auswahl hat man Hochleistungsstamme 
erzeugt, die Antibiotika in groRen Mengen synthetisieren. Produzierte der von 
Fleming isolierte Stamm noch 0,0012 g Penicillin pro Liter Kultur, so erzielt man in 
heutigen Prozessen ca. 50 g PenicHin oder uber 20 g Cephalosporin C pro Liter 
Kulturmedium. eine notwendige weitere Verbesserung der Selektivitat und 
Produktivitat erfordert jedoch immer bessere Produktionsstamme. Dieses ist nicht 
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mehr atlein durch Zufallsmutagenese zu erreichen, sondern erfordert alternative 
Methoden. Der Einsatz molekulargenetischer Techniken zur gezielten 
Beeinflussung der Biosyntheseenzyme erscheint deshatb vielversprechend zu sein. 

3. Physikalische Organisation des pcbABIpcbC intergenischen Bereichs von 
Acremonium chrysogenum 

Beim Versuch, aus Streptomyces coelicolor Gene zu klonieren, die an der 
Biosynthese des Antibiotikums Actinorhodin beteiligt sind, wurde zunachst 
festgestellt, daB die gesamte Information, die zur Biosynthese notwendig war, auf 
einem 33 000 Basenpaare iangen DNA-Fragment lag. Nach Transformation dieses 
Fragmentes in einen anderen Stamm von Streptomyces, welcher diese Gene nicht 
enthielt, konnte dieser Actinorhodin synthetisieren. Dieses war der erste Hinweis auf 
eine Vielzahl von Antibiotikasynthesegenen auf einem relativ kurzen DNA-Aoschnitt 
in einem Prokaryonten. Spater konnte gezeigt werden, daft die Kopplung der 
Biosynthesegene fur ein anderes Antibiotikum, das Cephamycin, bei Streptomyces 
soweit geht, dafi die Information aus zwei verschiedenen Genen, dem fur die 
Epimerase (cefD) und dem fur die Expandase (cefEF), gemeinsam in RNA 
umgeschrieben wird. Parallel dazu wurde untersucht, ob in Eukaryonten ahnliche 
Verhaltnisse vorliegen. Experimente mit Penicillium zeigten, dali das penDE-Gen, 
das fur eine Isopenicillin-N-Acyltransferase kodiert, unmittelbar stomabwarts des 
pcbC-Gens lag. Das entgegengesetzt transkribierte pcbAB-Gen ist ebenfalls dem 
pcbC-Gen unmittelbar benachbart. Damit wurde gezeigt, dafi die Gene fur den 
Biosyntheseweg der Penicilline als "Cluster" organisiert sind. 

In A. nidulans findet sich die gleiche Anordnung der Pernicillinbiosynthesegene wie 
bei P. chrysogenum, Untersuchungen an A. chrysogenum oder beim Actinomyceten 
Nocardia Lactamdurans zeigten. da(J hier ebenfalls die fur die generellen Schritte 
der Penicillinbiosynthese verantwortlichen Gene in gleicher Weise organisiert sind. 
bei den bakteriellen p-Lactamproduzenten, welche die Biosynthese uber den 
Cephamring fortsetzen, liegen die Gene fur die darauffolgenden Schritte ebenfalls 
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nebeneinander, in Acremonium dagegeben in einem separaten •'Gen-cluster" auf 
dem Chromosom II. Interessant sind Untersuchungen an Hochleistungsstammen 
von P. chrysogenum bezuglich ihrer Gendosis. In einem Stamm mit erhohter 
Penlcillinproduktion liegt das pcbC-Gen in mehreren Kopien und im 
Hochleistungsstamm As-P-78 der gesamte "Cluster" der Gene funffach vor. Durch 
die Genvervielfachung kommt es zu einer erhohten Biosynthese der Genprodukte, 
da mehrere Kopien gleichzeitig exprimiert werden konnen. 

Das B-Lactamantibiotikum Cephalosporin C wird durch die enzymatische Aktivitat 
mehrerer Proteine in A, chrysogenum synthetisiert. Die ersten beiden 
Syntheseschritte werden durch die AC-/ACV-Synthetase und die Isopenicillin N- 
Synthetase katalysiert. Beide Enzyme werden durch das pcbAB- bzw. das pcbC- 
Gen kodiert, welche im Genom benachbart und divergent angeordnet sind. Die 
Transkription beginnt im gemeinsamen intergenischen Promotorbereich der beiden 
Gene. 

4. Das Hefe ONE-HYBRID-SYSTEM als Methode zur Isolation von 
Transkriptionsfaktoren 

Das ONE-HYBRID-SYSTEM (Clontech 1995) bietet die Moglichkeit, Interaktionen 
zwischen DNA-Sequenzen und Proteinen zu untersuchen. Die Analyse der DNA- 
Protein-lnteraktion wird ahnlich wie bei dem analogen TWO-HYBRID-SYSTEM 
(Protein-Protein-lnteraktion. Fields und Song 1989) mit Hilfe eines Reportergens in 
der Backerhefe Saccharomyces cerevisiae durchgefuhrt. Das Verfahren wurde von 
Wang und Reed (1993) entwickelt und erstmals erfolgreich bei der Klonierung eines 
olfaktorischen Transkriptionsfaktors eingesetzt. 

Sowohl die analysierte DNA-Sequenz als auch die prasumptiven DNA-bindenden 
Proteine des untersuchten Organismus werden in einen Hefestamm eingebracht 
(siehe Figur 1). Das DNA-bindende Protein wird als Fusionsprotein mit der 
transkriptionsaktivierenden Domane des GAL4-Proteins der Hefe exprimiert. Eine 
Interaktion des DNA-bindenden Polypeptids mit der analysierten DNA-Sequenz. 
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welche stromaufwarts eines Reportergens integriert wird, ermoglicht die 
Transkriptionsinitiation des Reportergens durch die fusionierte GAL4-Domane. 
Diese transkriplionsaktivierende Proteindomane gelangt bei der beschriebenen 
DNA-Protein-lnteraktion in raumliche Nahe des Transkriptionsstartpunktes. Als 
Reportergene werden das H/S3-Gen (in dem Vektor pHISi) und das lacZ-Gen (in 
dem Vektor pLACZi) eingesetzt. Das H/S3-Gen ermoglicht die direkte Selektion auf 
solche Hefezellen, bei denen die beschriebene DNA-Protein-lnteraktion stattfindet. 
Das /acZ-Gen eriaubt die Quantifizierung der Reportergenaktivitat und damit die 
Messung der Bindungsaffinitat zwischen Protein und analysierter DNA-Sequenz. 
Neben dem Nachweis der DNA-Protein-lnteraktion zwischen zwei bekannten 
Komponenten kann das ONE-HYBRID-SYSTEM auch zur Isolation bislang 
unbekannter frans-wirkender Faktoren einer DNA-Sequenz eingesetzt werden. 
Hierbei wird mit einer Expressionsgenbank (cDNA-Bank) des untersuchten 
Organismus gearbeitet. Die cDNA«Bank wird in dem Hefe-Expressionsvektor 
pGAD424 angelegt, so da(i die klonierten cDNAs zusammen mit der GAL4-Domane 
in der Hefe exprimiert werden konnen. Durch die Selektion auf die Expression von 
Reportergenen konnen solche cDNAs identifiziert werden. deren Proteinprodukte in 
diesem in wVo-System eine funktionelle DNA-Bindeaktivitat besitzen. 

Aus dem 1 ,2 kb umfassenden Promoter wurde eine DNA-Sequenz von 24 
Nukleotiden (Position -447 bis -423) ausgewShIt und als Zielelement im ONE- 
HYBRID-SYSTEM zur Isolation eines spezifischen Transkriptionsfaktors eingesetzt 
(Figur 2). Die Sequenz enthalt eine sogenannte CCAAT-Box. die in den Promotoren 
und Enhancer-Regionen vieler eukaryontischer Gene gefunden wurde (z. B. 
Nussinov R 1992). Es existieren mehrere unterschiedliche Transkriptionsfaktoren, 
die an dieses Motiv binden (z. B. Raymondjean et al. 1988). Z,B. wurde das Am 
Alpha Binding-Protein (AAB) von Neurospora crassa aufgrund seiner Affinitat zu 
einem CCAAT-enthaltendem Promotorfragment kloniert. Durch Mutagenese des 
CCAAT-Motivs konnte die Spezifitat des AAB-Transkriptionsfaktors fur diese 
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Sequenz gezeigt werden (Chen und Kinsey 1995). Bei Aspergillus nidulans konnte 
eine DNA-Protein-lnteraktion im Bereich einer solchen CCAAT-Box nachgewiesen 
werden (Then Bergh et al. 1996). 

Die Synthese des Anitbiotikums in A. chrysogenum unterliegt einer Reihe von 
Faktoren (Kohlenstoffquellen, pH-Wert und Sauerstoffgehalt des Mediums, usw.), 
deren Umsetzung auf die molekulare Regulation der Genexpression unbekannt ist 
(Ubersicht bei Nosek et al. 1997). Transkriptionsfaktoren mit spezifischen Affinitaten 
fur DNA-Sequenzen des regulatorischen Bereichs der pcbAB/pctoC-Gene sind Mittel 
der molekularen Regulation. Bei Kenntnis und Verfugbarkeit solcher 
Transkriptionsfaktoren und der entsprechenden Gene erschliefien sich neue 
Moglichkeiten, die Regulation der Cephalosporin C-Biosynthese zu untersuchen 
und die gewonnenen Erkenntnisse auf die Antibiotika-Produktion zu ubertragen. 

Die der vorliegenden Erfindung zugrundeliegende Aufgabe ist demgemali das 
Auffinden von Genen fur Transkriptionsfaktoren, die an der Genregulation der 
Biosynthesegene von Cephalosporin C beteiligt sind, urn ietztlich eine 
Ausbeutesteigerung an Cephalosporin C in entsprechenden 
Fermentationsprozessen zu erreichen. 

Oberraschenderweise wurde bei der Losung dieser Aufgabe mittels des Hefe ONE- 
HYBRIDSYSTEMS das Gen eines DNA-bindenden Proteins (cpcR1-Gen) entdeckt, 
dessen Gen-Produkt (CPCR1) im intergenischen Bereich der pcbAB und pcbC- 
Gene von A chrysogenum bindet und der Familie der RFX-proteine (Emery et al., 
1996) zuzurechnen ist. Dies ist um so uberraschender, ais da& man aufgrund des 
Vorliegens einer CCAAT-Box im zum Screening benutzten DNA-Fragment eigentlich 
ein Protein aus einer Protein-Familie erwartet hatte, welche aus Mitgliedern besteht, 
die spezisch an das Sequenzmotiv "CCAAT-Box" binden. Eine mogliche Erklarung 
fur diesen uberraschenden Befund ist die Struktur der erfindungsgemaBen DNA 
BindestelleiGTTGCCGGGCCAATCCCTGAGCTT (SEQ ID No.: 4). Die Sequenz 
enthalt ein palindromisches Sequenzmotiv. welches wohl die Bindungsstelle fur das 
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CPCRI-Protein darstellt; die CCAAT-Box uberlappt lediglich leilweise mit dieser 
Sequenz. 

Ein Gegenstand der Erfindung ist ein DNA-bindendes Protein, welches als 
Monomer, Homodimer oder Teil eines Heterodimer an doppelstrangige DNA der 
Sequenz GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO.: 4) aus dem 
intergenischen Bereich des pcbAB und pcbC-Gens von Acremonium chrysogenum 
bindet und in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens zu 
beinflussen, insbesondere dadurch gekennzeichnet, dal^ es die 
Aminosauresequenz des CPCR1 -Proteins gemaS Tabelle 7 (SEQ ID NO.: 20) oder 
Teile davon enthalt. 

Ein weiterer Gegenstand der Erfindung ist ein Fusionsprotein. enthaltend die 
Aminosauresequenz des CPCR1 -Proteins gemali Tabelle 7 (SEQ ID NO.: 21) oder 
Teile davon und eine Transaktivierungsdomane, welche in der Lage ist, die 
Transkription des pcbAB und/oder pcbC-Gens zu beinflussen. 

Insbesondere ist das Fusionsprotein dadurch gekennzeichnet, dali die genannten 
Teile des CPCR1 Proteins der DNA-Bindungsdomane (Aminosauren 180 bis 254 
gemafi Tabelle 7) und der Dimerisierungsdomane (Aminosauren 502 bis 660 gemaB 
Tabelle 7) entsprechen und/oder die Transaktivierungsdomane vom 
Transkriptionsfaktor GAL4 (Aminosauren 768 bis 881 ) stammt. 

Ein weiterer Gegenstand der Erfindung ist ein DNA-Molekul, kodterend fur ein 
Protein wie vorgehend beschrieben. Dieses DNA-Molekut ist insbesondere dadurch 
gekennzeichnet, da& 

(a) es eine DNA-Sequenz gemafi Tabelle 6 (SEQ ID NO.: 20) oder Teile davon 
enthSIt; 

(b) es eine DNA-Sequenz enthalt, die in der Lage ist, mit dem DNA-Molekui 
gemaS (a) unter stringenten Bedingungen zu hybridisieren, oder Teile davon; 
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(c) es eine DNA-Sequenz enthalt, die aufgrund der Degeneriertheit des 

genetischen Codes von den DNA-Molekulen gemafi (a) und (b) verschieden 
ist, jedoch die Expression der entsprechend mit den DNA-Molekiilen gemali 
(a) und (b) exprimierbaren Proteinen ermoglicht. oder Teile davon. 

Ein weiterer Gegenstand der Erfindung ist ein Vektor, enthaltend eine DNA wie 
vorhergehend beschrieben. Insbesondere ist dieser Vektor dadurch 
gekennzeichnet, da(i es ein Vektor geeignet zur Expression in Acremonium 
chrysogenum oder Saccharomyces cerevisiae ist. 

Bevorzugt ausgewahit wird der Vektor aus der Gruppe enthaltend die Vektoren 
pGC1 und pGC1ADIM1. 

Ein weiterer Gegenstand der Erfindung ist eine Wirtszelle, enthaltend eine oder 
mehrere Kopien eines Vektors oder einer DNA wie vorhergehend beschrieben. 
insbesondere dadurch gekennzeichnet, daR sie ausgewdhit ist aus der Gruppe 
enthaltend Acremonium chrysogenum und Saccharomyces cerevisiae, 

Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung eines DNA- 
bindenden Proteins wie vorhergehend beschrieben, dadurch gekennzeichnet, dali 
eine DNA wie vorhergehend beschrieben mittels eines Vektors wie vorhergehend 
beschrieben in einer Wirtszelle wie vorhergehend beschrieben exprimiert und 
isoliert wird. 

Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Steigerung der 
Cephalosporin C-Ausbeute in Acremonium chrysogenum, bei dem die Expression 
des cpcR1-Genprodukts variiert wird, insbesondere dadurch gekennzeichnet, dali 
die variierte Expression durch Einbringen einer oder mehrerer Kopien des cpcR1- 
Gens in den Wirtsorganismus zusatzlich zum endogenen cpcR1-Gen. erreicht wird 
Oder auch dadurch gekennzeichnet, dad die variierte Expression durch Integration 
einer oder mehrerer zusatzlicher DNA-Bindesequenzen TTGCCGGGCCAAT (SEQ 
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ID NO.: 1) Oder Varianten gleicher Funktion des DNA-bindenden Proteins wie 
vorhergehend beschrieben. im pcbAB/pcbC-Promotors erreicht wird. 

Ferner ist Gegenstand der Erfmdung eine DNA-Bindungsstelle fur ein DNA- 
bindendes Protein wie vorhergehend beschrieben, ausgewahit aus der Gruppe 
enthaltend die doppelstrangigen Sequenzen GTTGCCGGGCCAATCCCTGAGCTT 
(SEQ ID NO.: 3), TTGCCGGGCCAAT (SEQ ID NO.: 1) und 
GTTGCCGGGCGTATCCCTGAGCTT (SEQ ID NO.: 8). 

Ein weiterer Gegenstand der Erfindung ist ein Vektor wie vorhergehend 
beschrieben, enthaltend eine Oder mehrere Kopien der DNA-Bindesequenzen des 
erfindungsgemafien DNA-bindenden Proteins wie vorhergehend beschrieben. 

Die Erfindung wird nun anhand der Beispieie, Figuren und Tabellen beschrieben, 
ohne darauf beschrankt zu sein. 

Beispiel 1: 

Isolation der cpcR1-cDNA von Acremonium chrysogenum mit Hiife des ONE- 
HYBRID-SYSTEMS 

Die im vorausgegangenen beschriebene DNA-Sequenz aus dem pcbAB/pcbC- 
Promotorbereich wurde eingesetzt urn mittels des ONE-HYBRID-SYSTEMS cDNA- 
Klone von A. chrysogenum zu isolieren, die fur DNA-Bindeproteine kodieren, Es 
wurde grundsatzlich so vorgegangen, wie im "Matchmaker One Hybrid System 
protocor* von Clontech beschrieben. Es wurde ein Oligonukleotid mit einer Lange 
von 80 Nukleotiden (nt) synthetisiert, welches die DNA-Sequenz (Position -447 bis - 
423 im pcibAB/pc6C-Promotor) in dreifacher Kopie enthalt (Tabelle 3). Am 5'-Ende 
wurden die Nukleotide AATTC zugefugt, um einen EcoRI-Uberhang zu erzeugen. 
Am 3'-Ende besitzt das Oligonukleotid die Nukleotide CCC. die zur 
Erkennungssequenz des Restriktionsenzyms Smal gehoren. Zudem wurde ein 
Oligonukleotid von 76 nt synthetisiert, dessen Sequenz komplemantar zum ersten 
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Oligonukleotid ist. Das 3'-Ende dieses Oligonukleotids schlielit mit einem G, so dali 
bei der Hybridisierung der beiden Oligonukleotide ein doppelstrangiges DNA- 
MolekCil entsteht, dessen 5'-Ende durch einen EcoRI-Uberhang charakterisiert ist. 
Dieses doppelstrSngige DNA-Molekul (BSII) wurde in die Reportergenplasmide 
pHISi und pLACZi (Clontech) integriert. Die Plasmide wurden zuvor mit den 
Restriktionsenzymen EcoRI und Smal geschnitten. Die erhaltenen Plasmide pHISi- 
BSII und pLACZi-BSlI (siehe Tabelle 4) wurden mittels DNA-Transformation in das 
Genom des Rezipientenstammes integriert. 

Der resultierende Hefestamm (siehe Tabelle 5) wurde zur Transformationen einer 
cDNA-Bank von A. chrysogenum eingesetzt. Als Ausgangsmaterial fur die cDNA- 
Synthese diente mRNA des A. chrysogenum-Siammes A3/2 (Radzio und Kuck, 
1997; DSM 11878) und fur die Konstruktion der cDNA-Bank wurde der Hefevektor 
pGAD424 (Clontech) verwendet. 

Es wurden zwei identische Klone identifiziert, die audi in wiederholten in vivo- 
Experimenten zu einer nachweisbaren DNA-Protein-lnteraktion mit dem Zielelement 
fuhrten. Die DNA-Sequenz der isolierten cDNA von A. chrysogenum ist in Tabelle 6 
dargestellt. Der isolierte Klon umfaBt ein cDNA-Fragment von 2541 bp und 
zusatzlich ein PolyA-Ende von ca. 80 Nukleotiden. 

Beispiel 2: 

Homologie des CPCR1 -Proteins zu Transkriptionsfaktoren der RFX-Famllie 

Die DNA-Sequenz der beschriebenen aus A chrysogenum isolierten cDNA enthalt 
einen offenen Leserahmen fur 786 Aminosauren (Tabelle 7). Ein Computervergleich 
der Proteinsequenz des cpcRI -Gens mit der EMBL-Datenbank ergab Homologien 
von 28 bis 22 Prozent zu verschiedenen Mitgliedern der Familie der RFX-Proteine. 
Die hochste Homologie besteht mit 28 % zum SAK1 -Protein von 
Schizosaccharomyces pombe. Das humane RFX1 -Protein ist von alien Mitgliedern 
der Familie am besten charakterisiert und besitzt zum CPCRI -Protein eine 
Homologie von 23,9 % uber einen Bereich von 476 Aminosauren. Die Homologien 
innerhalb der konservierten ProteindomSnen liegen deutlich hoher (Abbildung 3 und 
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Tabellen 8 und 9). Die Transkriptionsfaktoren der RFX-Familie sind durch eine 
Reihe von konservierten Proteindomanen gekennzeichnet (Ubersicht bei Emery et 
al. 1996), Die Proteine besitzen eine 76 Aminosauren umfassende sogenannte 
RFX-DNA-Bindedomane. deren Konsensus-Sequenz keine Homologie zu anderen 
bekannten DNA-BindedomSnen aufweist. Daneben enthalten die meisten Mitglieder 
der Proteinfamilie eine putative Dimerisationsdomane, die weniger stark konserviert 
ist. Durch Homologievergleiche der RFX-Proteine konnten weitere konservierte 
Proteinregionen (A,B und C) lokalisiert werden, deren Funktion unbekannt ist. 
AuQerdem enthalten einige Mitglieder der Familie Bereiche, in denen bestimmte 
Aminosauren besonders haufig vorkommen. Das CPCR1 -Protein besitzt die 
konservierten Regionen B und C, sowie im N-terminalen Bereich eine Prolin- und 
Glutamin-reiche und im C-terminalen Teil eine AsparaginsSure- und Glutaminsaure- 
reiche Region (Abbildung 3). 

Die Deletion der C-termlnalen 1,3 kb des CPCR1 -Proteins in dem Vektor pGC1 fuhrt 
zu dem Plasmid pGCIADIMI. Bei dieser Deletionsmutante sind die Nukleotide 1213 
bis 2372 gemali Tabelle 6 deletiert. Dies bedeutet, daR das mit dem Plasmid 
pGCIADIMI exprimierbare Protein die Aminosauresequenz von Position 1 bis 
Position 402 gemSB Tabelle 6 hat. 

Hefezellen des Stammes BSII (siehe Tabelle 2) mit dem Plasmid pGCIADIMI sind 
im Gegensatz zu solchen mit dem Ausgansplasmid pGCI nicht mehr in der Lage auf 
HIS-Selektionsplatten mit 55 mM 3-Aminotriazol zu wachsen. Dies deutet darauf hin, 
da(i die DNA-Bindeaktivitat des CPCR1 -Proteins von der Dimerisationsdomane 
abhangt. MoglichenA^eise bindet der Transkriptionsfaktor in diesem in vivo- 
Experiment nur als Homodimer an die DNA-Zielsequenz und fuhrt somit zur 
Expression des HIS3-Reportergens. 
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Beispiel 3: 

In wVo-Analysen zur Spezifitat der DNA-Protein-lntieraktion des CPCR1 -Proteins 

Transkriptionsfaktoren sind DNA-Bindeproteine, die in den meisten Fallen durch 
eine spezifische Interaktion mit DNA-Sequenzen eines Promotors an der 
transkriptionellen Regulation der Genexpression beteiligt sind. Zur exakten 
Bestimmung der Nukleotide, die fur die spezifische Interaktion des CPCR1 -Proteins 
mit Bereichen des pc/)AB/pc/)C-Proniotors notwendig sind. wurden Mutationen in 
die presumptive Bindestelle eingebracht. Es wurden hierzu Oligonukleotide 
synthetisiert (BSIIm1-3). deren Sequenz jeweils an einer Stelle uber einen Bereich 
von 2 bis 5 Nukleotiden von der Ausgangssequenz (BSII) abweicht. In der Tabelle 2 
sind die Sequenzen der mutierten Oligonukleotide angegeben. Die dargestellen 
Sequenzen wurden in dreifacher Kopie synthetisiert und wie in Beispiel 1 
beschrieben in das Hefegenom integriert. Die ReportergenaktivitSt des /acZ-Gens 
bei Expression des CPCR1 -Proteins in den resultierenden Hefestammen ist in der 
Tabelle 2 angegeben. Die Substitution der Nukleotide CCAAT zu GGTTA in dem 
Oligonukleotid BSIIml fuhrt zu einem Verlust der /acZ-Aktivitat des entsprechenden 
Hefestammes. Die Nukleotide CAA bilden moglicherweise die rechte Halfte einer 
palindromischen Erkennungssequenz fur den Faktor CPCR1. Bei einer Substitution 
der entsprechenden Nukleotide (TTG zu AAC) in der putativen linken Halfte des 
Palindroms ist ebenfalls ein Verlust der /acZ-Aktivitat festzustellen (siehe BSIImS). 
Diese Ergebnisse sprechen dafur, daQ die Erkennungssequenz des 
Transkriptionsfaktors CPCR1 eine palindromische Struktur aufweist. Eine 
Substitution der Nukleotide GT in dem Oligonukleotid BSIIm2 zerstort das 
Palindrom nicht vollstandig und bewirkt auch keinen Verlust der /acZ-Aktivltat. 
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Beispiel 4: 

Nachweis des cpcR1-Gens in Acremonium chrysogenum durch DNA- 
Hybridisierungen 

In der Figur 4 ist eine Southern-Hybridisierung unter stringenten Bedingungen mit 
genomischer DNA des Acremonium chrysogenum Stammes A3/2 dargestellt. Die 
DNA wurde mit den Restriktionsenzymen EcoRI, BamHl bzw. HincnW geschnitten 
und gelelektrophoretisch aufgetrennt. Als Sonde diente ein 2.4 kb-Fragment der 

cpcR1-cDNA. welches mit ^^Phosphor radioaktiv markiert wurde. Bei dem 2.4 kb 
grofien Hybridisierungsfragment handelt es sich urn ein Pstl-Fragment. welches 
innerhalb des rekombinanten Plasmids pGC1 folgende Position einnimmt: das 
Fragment erstreckt sich von der PstI Erkennungsstelle an der Nukleotidposition 129 
innerhalb des offenen Leserahmens des cpcRI-Gens bis zur Pstl-Erkennungsstelle 
innerhalb der multiplen Klonierungsstelle des rekombinanten Plasmids. Die multiple 
Klonierungsstelle stammt von dem Ausgangsvektor pGAD424. Somit sind in dem 
Hybridisierungsfragment alle Genbereiche enthalten, mit Ausnahme der ersten 129 
Nukleotide. Da in der genomischen DNA jeweils nur 1 Fragment markiert wird (7 bis 
ca. 15 kb), liegt das cpcRI-Gen wahrscheinlich in Einzelkopie im Genom von A 
chrysogenum vor. 

Hybridisierungspuffer: 50 % Formamid; 5x SSPE; 0.2 % SDS; 100 pg/ml 
Heringssperma-DNA; Hybridisierungsbedingungen: 1 h Vorhybridisierung bei 37X; 
12 h Hybridisierung mit radioaktiv (^^P)-markierter Sonde; Waschpuffer: 5x SSPE, 
0,2 % SDS; Waschbedingungen: 10 min bei 60X. 

Beispiel 5: 

Nachweis des cpcR1-Gentranskripts in Acremonium chrysogenum durch RNA- 
Hybridisierungen 

Die Expression des cpcRI-Gens in 3 verschiedenen Acremonium chrysogenum 
Stammen wurde mittels einer Northern-Hybridisierung untersucht (Figur 5). Das als 
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Sonde eingesetzte radioaktiv-markierte Fragment des cpcR1-Gens (s. o.) markiert 
in der Gesamt-RNA von A. chrysogenum ein RNA-MolekDI von etwa 3,5 kb. Die 
Unterschiede in der Intensitat der Hybridisierung zwischen den 3 Pilzstammen {A. c. 
ATCC 14553, A3/2 und Ac1) deuten auf eine unterschiedlich starke Expression des 
cpcRI-Gens hin. Eine h6here Expression des Transkriptionsfaktors CPCR1 in den 
beiden Semi-Produzentenstammen A3/2 und Ac1 korreliert mit der erhohten 
Cephalosporin-Syntheseleistung dieser Stamme. Dieses Ergebnis weist auf die 
megllche regulatorische Wirkung des CPCR1 -Proteins fur die Cephalosporin C- 
Biosynthese hin. Hybridisierungspuffer: 50 % Formamid; 5x SSPE; 0,2 % SDS; 200 

pg/ml Heringssperma-DNA; Hybridisierungsbedingungen: 2 h Vorhybridisierung bei 
37'C; 12 h Hybridisierung mit radioaktiv (^^P)-markierler Sonde; Waschpuffer: 5x 
SSPE, 0,2 % SDS; Waschbedingungen: 10 min bei BO'C. 

Beispiel 6: 

Konstruktion von Expressionsvektoren fur Acremonium chrysogenum 

Im folgenden werden die Expressionsvektoren pIRII. plR12, plR13, plR21, plR22, 
plR23, plR31 , plR32 und plR33 beschrieben. Die Konstruktion der Vektoren vi/urde 
nach Standardmethoden der molekularen Genetik vorgenommen (Sambrook et al. 
1 989). Die Nukleotidsequenz der Vektoren ist aus Tabelle 10 abzuleiten. 

Allgemeine Beschreibung der Vektoren: 

1 . Alle Vektoren basieren auf dem bakteriellen Plasmid PCRScript+AmpSK(+) 
(Stratagene, Heidelberg) und erhalten fur die Vermehrung in E. coli einen 
Replikationsursprung, v^elcher in E. coli wirksam ist. Aulierdem tragen sie ein 
Ampicillin-Resistenzgen, v^^elches fur eine p-Lactamase kodiert. Die Selektion in 
E.coli wird durch das Resistenzgen ermoglicht. In Tabelle 10 wird der 
PCRScript+AmpSK(+)-Anteil als "bakterieller Anteil" bezeichnet. 
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2. Alle Vektoren enthalten den Promotorbereich des pcbC-Gens (Samson et aL 
1985. Menne et al. 1994). 

3. Alle Vektoren enthalten die Transkriptions-Terminationssignale des pcbC- 
Gens (Samson et al. 1985) 

4. Die Vektoren enthalten variable Klonierungsinsertionsschnittstellen. die durch 
die Linker der Tabelle 1 1 bestimmt werden. 

Die drei unterschiedlichen Klonierungsinsertionsstellen unterscheiden sich lediglich 
durch einzelne Nukleotide (unterstrichen in der Tabelle 11). Dadurch ist eine 

Translationsfusion von zwei Gensequenzen in den drei moglichen Leserahmen 
eines Protein-kodierenden Gens moglich. 

5. Die Vektoren plR21. plR22, plR23 und plR31. plR32, plR33 enthalten 
Sekretions-Signalsequenzen fur Translationsfusionen. 

Um eine effiziente Expression und eine moglichst einfache Reinigung des 
heterologen Genprodukts zu ermSglichen, wurden unmittelbar vor der 
Klonierungsinsertionsstelle sogenannte Sekretions-Signalsequenzen eingefugt. die 
einen Transport des exprimierten Proteins in das endoplasmatische Reticulum und 
schlielilich eine Sekretion aus den Zellen bewirken. Das Genprodukt sollte somit in 
den Kulturuberstanden der entsprechenden Pilztransformanten vorliegen. Es 
wurden zwei verschiedene Export-Signalsequenzen verwendet: 

a) Zum einen handelt es sich um eine Sequenz mil einer Lange von 42 bp. die 
Teil eines Gens ist. das fur eine alkalische Protease aus dem Pilz Fusarium sp. 
kodiert. Das kodlerte Signalpeptid hat eine Lange von 14 Aminosauren und wurde 
bereits in Saccharomyces cerevisiae und in A. chrysogenum auf seine Funktionalitat 
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getestet, jedoch nicht in Verbindung mit einem heterologen Gen (Kitano et al. 1992). 
Die Signalsequenz ist in den Vektoren plR21, plR22 und plR23 enthalten. 

b) Die zweite venvendete Signalsequenz stammt aus A. chrysogenum und ist 
ebenfalls Teil eines Gens, das fur eine alkalische Protease kodiert. Diese Sequenz 
hat eine Lange von 60 bp, wobei das resultierende Signalpeptid, dessen 
Funktionalitat gleichfalls in S. cerevisiae und A, chrysogenum verifiziert wurde, eine 
Lange von 20 AminosSuren hat (Isogai et al. 1991). Die Signalsequenz aus A. 
chrysogenum ist in den Vektoren plR31. plR32, plR33 enthalten. 

Zusammenfasend werden die Ubergangssequenzen der neun Expressionsvektoren 
in der Tabelle 12 angegeben. 

Beispiel 7: 

Expression des CPCR1 Proteins in A. chrysogenum 

Die im Beispiel 6 beschreibenen Vektoren konnen benutzt werden. urn das CPCR1 
Protein in A, chrysogenum zu exprimieren. 

Zu diesem Zweck kann das cpcRI-Gen aus dem Plasmid pGCI durch PCR- 
Amplifikation (Sambrook et al. 1989) synthetisiert werden. Bei dieser Amplifikation 
werden die folgenden zwei Primer eingesetzt (in Kiammern sind die Positionen der 
Oligonukleotide innerhalb der Nukleotidsequenz gemali Tabelle 6 genannt). 

1. 5'CCT GCT ATG TAG GGA CAA GGG3' (10-30) (SEQ ID NO.: 54) 

2. 5'CC TCG TCA TGC AGG AGO CGC CC3' (2351-2372) (SEQ ID NO.: 55) 

Durch die Amplifikation erhalt man ein 2362 bp groSes DNA-Fragment, das durch 
DNA-Sequenzierung auf seine Korrektheit hin uberpruft wird. Dieses Fragment wird 
in die Nrul-Restriktionsstelle des Plasmids pIR1 1 kloniert. Durch das Enzym Nrul 
wird ein sogenanntes "stumpfes Ende" hergestellt, mit dem die Klonierung des PCR- 
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Fragments ohne vorausgegangene Restriktrion moglich wird. Durch die Ligation des 
Vektors und des PCR-Fragments entsteht ein rekombinantes Plasmid mit der 
Bezeichnung pIRSH, das anschlieliend in £. co// kloniert und vermehrt werden 
kann. 

Durch anschlieliende DNA-Kotransformationsexperimente (Menne et al. 1994) wird 
das Plasmid in A.chrysogenum eingebracht. In der Regel erfolgt eine ektopische 
Integration des Ptasmids in mehrereri Kopien in das pilzliche Genom. Es konnen 
also pilzliche Transformanten mit mehreren Kopien des cpcRI-Gens unter der 
Kontrode des pcbC-Promotors erhalten werden. Die anschlieBende molekulare 
Analyse der Pilztransformanten eriaubt die Selektion geeigneter Stamme. Diese 
sollten das CPCR^-Protein ubersynthetisieren und somit eine erhohte Expression 
der Cephalosporin C-Biosynthesegene aufgrund der CPCR^-Wirkung zur Folge 
haben. 

Beispiel 8: 

Charakterisierung der Dimerisationsdomane des CPCR1 -Proteins 

Das CPCR1 -Protein besitzt vermutlich mindestens zwei wichtige funktionelle 
Domanen, die DNA-Bindedomane und die Dimerisationsdomane. Die 
Charakterisierung der potentiellen Dimerisationsdomane wird im folgenden durch 
in vivo Experimente mit Derivaten des CPCR1 -Proteins beschrieben. Die Analysen 
wurden mit geeigneten Hefestammen in Form von ONE-HYBRID und TWO-HYBRID 
Versuchen durchgefuhrt. 

A. ONE-HYBRID Experimente zur in vivo DNA-Bindeaktivitat von Wildtyp und 
mutiertem CPCR1 -Protein. 

Mit dem ONE-HYBRID-System kann die DNA-Protein-lnteraktion in vivo untersucht 
werden. Dabei besteht die Moglichkeit, die DNA-Bindesequenz zu variieren und so 
eine Aussage uber Nukleotide zu erhalten, welche fur die Protein-Bindung essentiell 
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sind. Andererseits kann auch der Protein-Anteil des analysierten Komplexes 
verandert werden. In beiden Fallen wird die Starke der Interaktionen durch eine 
Messung der ReportergenaktivitSit ermittelt. 

Die Reportergenaktivitat von Hefetransformanten im ONE-HYBRID-System be! 
Expression des cpcR1-Gens und dessen Deletionskonstrukten sind in der Figure 
dargestellt. Das Plasmid pGC1 kodiert fur ein Fusionsprotein aus der GAL4-AD und 
dem CPCR1 -Protein von A. chrysogenum. Die Transformation dieses Plasmids in 
den Reportergenstamm mit der Bindestelle il aus dem pcbC-Promotor resultiert in 
einer hohen B-Galaktosidase-Aktivitat (siehe Figur 6). 

Wahrend der Interaktion des CPCR1 -Proteins mit der Bindestelle erfolgt eine 
Aktivierung der Transkription des Reportergens durch die fusionierte GAL4- 

Domane. Die Expression des cpcR1-Gens ohne die aktivierende DomSne (CPCR1) 
fCihrt v^^ie in der Figur 6 zu erkennen nicht zu einer erhohten Reportergenaktivitat. In 
der Abbildung sind auBerdem die Auswirkungen von Deletionen innerhalb des 
cpcR1-Gens dargestellt. Das Protein AD-DIM1 besitzt nur die N-terminale Halfte 
des CPCR1 -Proteins. Dadurch fehit die Dimerisationsdomane vollstandig. wShrend 
die DNA-Bindedomane erhalten bleibt. Hefetransformanten, in denen dieses Derivat 
des CPCR1 -Proteins gebildet wird, zeigen keine Reportergenaktivitat, was auf eine 
fehlende DNA-Bindung hinweist. Die Auswirkungen einer kleineren Deletion sind bei 
dem Protein AD-DIM2 erkennbar. Hier beginnt die Deletion in der Mitte der 
Dimerisationsdomane, so daft die N-terminale Halfte der Domane erhalten bleibt. 
Die B-Galaktosidase-Aktivitat eines Proteinextraktes von Hefetransformanten mit 
diesem Konstrukt liegt bei 32 U/mg Protein. Dies entspricht etwas mehr als 5 % der 
Aktivitat des Wildtyp-Proteins. Diese ONE-HYBRID Versuche zeigen. daft 
Deletionen des CPCR1 -Proteins zu einem unterschiedlich starken Verlust der 
analysierten DNA-Bindeaktivitat fuhren. 

Der Einsatz von Derivaten des CPCR1 -Proteins im ONE-HYBRID-System erlaubt 
die Analyse funktioneller Proteindomanen. Die Dimerisationsdomane des CPCR1- 
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Proteins scheint eine entscheidende Rolle fur die DNA-Bindeaktivitat des Proteins 
zu besitzen, denn eine vollstandige oder unvollstandige Deletion dieser Domane 
fuhrt zu einer starken Abnahme der Reportergenaktivitat. 

B. TWO-HYBRID Experimente zur Bestimmung von Protein-Protein- 
Interaktionen zwischen dem CPCR1 -Protein und dessen Derivaten 

Das TWO-HYBRID-System ermoglicht den direkten Nachweis von Protein-Protein- 
Interaktionen (Fields und Song 1989). Es wird, wie das ONE-HYBRID-System, in 
der Hefe S. cerevisiae durchgefuhrt. Die beiden auf eine mogliche Interaktion zu 
testenden Proteine mussen jeweils als Fusionsproteine mit zwei verschiedenen 
Domanen des GAL4-Proteins der Hefe in einen geeigneten Hefestamm eingebracht 
werden. Die DNA-Bindedomane des GAL4-Proteins (BD) wird mit dem einem 

Interaktionspartner fusioniert, die aktivierenden Domane des GAL4-Proteins (AD) 
mit dem anderen Protein. Interagieren die beiden Proteine miteinander, gelangen 
die beiden GAL4-Domanen in rSumliche Nahe zueinander und es kommt zur 
Expression von Reportergenen in den entsprechenden Hefetransformanten. 
Die im vorherigen Abschnitt verwendeten Derivate des CPCR1 -Proteins wurden 
auch im TWO-HYBRID-System eingesetzt. Dazu wurden das CPCR1 -Protein und 
die Proteine DIM1 und DIM2 (siehe Figur 6) mit der DNA-Bindedomane (BD) des 
GAL4-Proteins fusioniert. Zusammen mit den bereits vorhandenen Konstrukten, die 
eine Fusion mit der aktivierenden Domane (AD) darstellen, konnen diese Proteine 
auf Interaktionen untereinander getestet werden. 

Es wurden samtliche Kombinationen der bereits beschriebenen Proteine untersucht. 
Zu diesem Zweck wrurden zunachst drei Stamme erzeugt, die jeweils die 
Fusionsproteine BD-CPCR1, BD-DIM1 und BD-DIM2 exprimierten. AnschlieSend 
wurden in diese Stamme entweder eines der drei entsprechenden Konstrukte mit 
den AD-Fusionen oder eines von zwei Kontroilplasmiden transformierl. Bei den 
Kontrollplasmiden handelt es sich um das Plasmid pGAD424. welches nur fur die 
AD kodiert und um das Plasmid pC1, welches das cpcR1-Gen ohne eine fusionierte 
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GAL4-Domane enthalt. In der Figur 7A befindet sich eine schematische Darstellung 
der funf Hefestamme mit den verschiedenen Proteinen. 
In dem verwendeten Hefestamm ist die Bindestelle des GAL4-Proteins 
stromaufwarts des H/S3-Gens integriert, so daft eine Interaktion der untersuchten 
Proteine zur Histidin-Prototrophie fuhrt. Entsprechend wurde die Analyse der 
Protein-Protein-lnteraktion in den Hefetransformanten auf Selektionsplatten 
durchgefuhrt (siehe Figur 7). Vom Wachstum der Hefezellen kann auf die Starke der 
Interaktion geschlossen werden. Ein ganz schwaches Wachstum entlang der 
Impfstriche geht auf die Hintergrundaktivitat des H/S3-Gens in den Hefezellen 
zuruck. 

Es wird deutlich, daft die Kombination von CPCR1 mit unverandertem CPCR1 zur 
starksten Wechselwirkung fiihrt (Figur 7B). Die Deletion im Protein DIM2 eriaubt 
noch eine Interaktion mil sich selbst. wenngleich die Affinitat der Interaktionspartner 

sehr gering ist (Figur 7D). Das Protein DIM1 mit der groBeren Deletion kann 

dagegen nicht mehr mit sich selbst interagieren (Figur 7C). 

In der Abbildung 15B und D ist auch zu erkennen, da(i das vollstandige CPCR1- 

Protein mit beiden Derivaten DIM1 und DIM2 interagieren kann. Allerdings ist die 

Interaktion mit DIM2 wesentlich starker als mit DIM1 . Die Kontrollproteine, AD und 

CPCR1 ohne die Fusion, fuhren in keinem Fall zu einem Wachstum der 

Hefetransformanten. 

Durch TWO-HYBRID Versuche konnte gezeigt werden, da(i das CPCR1 -Protein mit 
sich selbst interagiert. Der Bereich der Dimerisationsdomane ist fur eine starke 
Interaktion notwendig. wenngleich eine schwache Interaktion wahrscheinlich auch 
uber die N-terminale Halfte des Proteins vermittelt werden kann. 
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Beispiel 9: 

Nachweis einer spezifischen Bindung des CPCR1 -Proteins an eine palindromische 
Sequenz des pc/?C-Promotors 

Bereits beim Durchsuchen der cDNA-Bank nach moglichen positiven 
Hefetransformanten wurde neben der Wildtyp-Bindestelle BSil aus dem pcbC- 
Promoter auch die mutierte Bindestelle BSIIml als Spezifitatskontrolle eingesetzt. 
Dadurch konnte uberpruft werden. ob der isolierte putative Transkriptionsfaktor von 
A. chrysogenum mit der Bindestelle in den Hefezellen sequenzspezifisch interagiert 
ist. Weitere Mutationen und Gelretentionsanalysen eriauben eine genauere 
Bestimmung der Bindestelle des CPCR1 -Proteins. 

A. In vivo Analysen des CPCR1 -Proteins mit mutierten Bindestellen unter 
Verwendung des ONE-HYBRID-Systems 

Das 24 Nukleotide umfassende DNA-Fragment BSII aus dem pc6C-Promotor, 
welches als potentielle Bindestelle eines Transkriptionsfaktors fur den Einsatz im 
ONE-HYBRID-System ausgewahit wurde, enthalt mit der Basenabfolge 5'-CCAAT-3' 

eine putative CCAAT-Box. Einige der Nukleotidpositionen in der CCAAT-Box sind 
zusStzlich Teil einer palindromischen Struktur. In der Figur 2 ist diese Sequenz 
wiedergegeben (BSil), wobei Nukleotide unterstrichen sind, die Teii des Palindroms 
sind. Mit Hilfe von Hefe-Reportergenstammen wurde untersucht, wie sich 
Mutationen in der CCAAT-Box und anderen Bereichen des Palindroms auf die in 
vivo DNA-Protein-lnteraktion im ONE-HYBRID-System auswirken. Dazu wurden die 
in Figur 2 dargestetlten mutierten Bindestellen 6Sllm2 und BSIIm3 in je dreifacher 
Kopie vor die Reportergene H/S3 und /acZ integriert, so daB zusammen mit BSIIml 
fur jedes Reportergen insgesamt drei Reportergenstamme mit mutierten 
Bindestellen zur Verfugung standen. Bei dem Stamm mit der Bindestelle BSIIml 
handelt es sich um den bereits beschriebenen Reportergenstamm. der zur Selektion 
des cDNA-Klons eingesetzt wurde (siehe Beispiel 1 ). Nach der Transformation des 
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Expressionsplasmids mil der cDNA des cpcRI-Gens in die genannten 
Reportergenstamme konnte die Aktivitat der Reportergene analysiert werden. 

Die Aktivitat des H/S3-Gens in den Transformanten wurde durch einen Wuchstest 
auf Selektionsplatten, die Expression des /acZ-Gens durch eine Messung der 
Enzymaktivitat bestimmt. Proteinextrakte aus Hefestammen mit der Wildtyp- 
Sequenz BSli zeigen eine Aktivitat der (1-Galaktosidase von 603 U/mg 
Proteinextrakt. In dem Stamm mit der Sequenz BSIIml ist die gesamte CCAAT-Box 
mutiert und damit auch die rechte Halfte des Palindroms. In Transformanten dieses 
Stammes ist die Aktivitat der (i-Galaktosidase mit neun U/mg Proteinextrakt sehr 
gering. Auch eine Mutation der linken Halfte des Palindroms (BSIIm3, 5,7 U/mg) 
fuhrt zu einem Verlust der Reportergenexpression, was auf eine gestorte DNA- 
Protein-lnteraktion hinweist. In der Sequenz BSIIm2 werden innerhalb der CCAAT- 
Box nur zwei Nukleotide ausgetauscht. Die resultierende Aktivitat der 
Galaktosidase betrflgt mit 140 U/mg Proteinextrakt weniger als ein Viertel der 
Wildtyp-Aktivitat. 

Reportergenanalysen mit mutierten Bindestellen im ONE-HYBRID-System zeigten, 
daB das CPCR1 -Protein spezifisch an eine palindromische Sequenz aus dem pcbC- 

Promoter bindet. Die rechte Halfte des Palindroms fallt mit einer CCAAT-Box 
zusammen. Beide Halften des Palindroms sind fur eine Bindung essentiell. 

B. In vitro Gelretentionsanalysen mit Proteinextrakten aus A. chrysogenum 
und rekombinanten Hefestammen 

Die Interaktion zwischen einem Protein und einem bekannten DNA-Fragment kann 
auch in vitro mittels der Gelretentionsanalyse untersucht werden, bei der radioaktiv 
markierte DNA, welche die Protein-Bindestelle enthalt, mit Proteinextrakten inkubiert 
wird. Anschlieliend werden DNA-Protein-Komplexe gelelektrophoretisch von freien 
DNA-Molekulen getrennt und durch Autoradiographie nachgewiesen. 
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Ein doppelstrangiges Oligonukleotid, welches dreimal die Sequenz der Bindestelle 
BSII (siehe Figur 2) enthalt, wurde durch den Einbau radioaktiver Nukleotide 
markiert und mit verschiedenen Proteinextrakten inkubiert. Protein-Rohextrakte 
wurden aus 

A, chrysogenum und rekombinanten Hefestammen gewonnen und durch „Fast- 
Protein-Liquid"-Chromatographie (FPLC) unter Verwendung einer Heparinsaule 
aufgereinigt und fraktioniert. 

MIt Proteinextrakt aus Acremonium und aus einem Hefestamm. der das CPCR1- 
Protein bildet, konnte eine spezifische DNA-Protein-lnteraktion mit der Bindestelle II 
nachgewiesen werden. Die Spezifitat der Bindung wurde durch 
Kompetitionsanalysen untersucht. Durch die Zugabe von nicht radioaktiv markierten 
DNA-Molekulen zum Reaktionsansatz kann getestet werden. ob das Protein auch 
an diese DNA-Molekule bindet und damit im verminderten Umfang den spezifischen 
DNA-Protein-Komplex bildet. Eine Kompetition mit der Bindestelle II fuhrt zu einer 
starken Abnahme des Komplexes. Bei Zugabe von Oligonukleotiden mit einer 
mutierten Sequenz (BSIIm3) kann dies nicht beobachtet werden. Dies deutet auf 
eine spezifische Interaktion zwischen dem CPCR1 -Protein und der Bindestelle II 
hin. 

Des weiteren wurden Gelretentionsanalysen mit 2 weiteren Hefestammen 
vorgenommen. Der eine Hefestamm exprimiert das CPCR1 -Protein als 

Fusionsprotein mit der transkriptionsaktivierenden Domane des GAL4-Proteins der 
Hefe (AD-CPCR1). Der andere Stamm wurde als Kontrolle verwendet und exprimiert 
nur die Domane des GAL4-Proteins (AD). Dieser Kontrollproteinextrakt fuhrt nicht 
zur Bildung des spezifischen DNA-Protein-Komplexes, der mit dem Protein AD- 
CPCR1 beobachtet werden kann. Durch diesen Vergleich der Hefeproteinextrakte 
konnte gezeigt werden, daB der Proteinextrakt AD-CPCR1 aus dem rekombinanten 
Hefestamm fur in vitro Bindungsstudien geeignet ist. 

Durch Gelretentionsanalysen konnte eine spezifische Interaktion von 
Proteinextrakten aus A. chrysogenum und rekombinanten Hefestammen mit der 
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Bindestelle II nachgewiesen werden. Damit bestatigt sich die Spezifitat der Bindung 
des CPCR1 -Proteins an die paiindromische Sequenz aus dem pci)C-Promotor auch 
in vitro, 

Beispiel 10: 

Genomische DNA von A, chrysogenum enthaltend das CPCR1-Gen 

Es wurde ein genomisches DNA-Fragment aus A. chrysogenum isoliert. welches 
das CPCR1-Gen enthSlt. Die Sequenz ist in Tabelle 13 gezeigt (SEQ ID NO.: 67). 
Der offene Lexrahmen beginnt bel Position 535 und endet bei Position 3130. Es 
sind 2 Introns enthalten: Intron 1 von Position 1215 bis Position 1267, Intron 2 von 
Position 1568 bis Position 1619. 

Figurlegenden: 

Fig. 1: Schema des ONE-HYBRID-SYSTEMS. Ein Hefe-Reportergenstamm wird mit 
einer Expressionsgenbank von ^A. chrysogenum transformiert. Bei einer DNA- 
Protein-lnteraktion zwischen dem heterologen Anteil des Fusionsproteins und dem 
analysierten DNA-Element (E) kommt es zur Expression des Reportergens (HIS3). 
Dieses Prinzip der Selektion auf Histidin-Auxotrophie eriaubt die direkte 
Identifizierung von Transformanden, deren Expressionsplasmid fur einen moglichen 

frans-Faktor kodiert. Abkurzungen: AD: transkriptionsaktivierende GAL4-Domane. 
BP: DNA-Bindeprotein, E: analysiertes DNA-Element. HIS3: Histidin- 
Biosynthesegen, P: Promoter 

Fig. 2: Schematische Darstellung des intergenischen Promotorbereiches der 
pcbAB/pcbC-Gene von Acremonium chrysogenum, Der Promotorbereich ist 
schraffiert. die Translationsstartpunkte der beiden divergenten Gene sind durch 
Pfeile markiert. Dargestellt ist die Sequenz (Position -447 bis -423) des Promoters, 
welche in dem ONE-HYBRID-SYSTEM zur Selektion spezischer 
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Transkriptionsfaktoren eingesetzt wurde, sowie Variationen davon. Ebenfalls 
dargestellt wird die quantitative Analayse der Aktivitat der fi-Galaktosidase von 
entsprechenden Reportergenstammen. 

Fig. 3: Schematische Darstellung des CPCR1 -Proteins. Die DNA-Bindedomane 
(DBD) und die Dimerisationsdomane (DIM) sind durch einen fettgedruckten Rahmen 
gekennzeichnet. Aufierdem sind die innerhalb der RFX-Familie konservierten 
Regionen B und C eingezeichnet. Proteinregionen. die einen erhohten Anteil 
bestimmter Aminosauren enthalten sind mit PQ (Prolin und Glutamin) bzw. mit DE 
(AsparaginsSure und Glutaminsaure) markiert. 

Fig. 4: Southern-Hybridisierung von Gesamt-DNA des A. chrysogenum-SXammes 
Ac1. Die Gesamt-DNA wurde mit Restriktionsenzymen wie angegeben geschnitten 
und gelelektrophoretisch aufgetrennt. Als Sonde wurde ein radioaktiv-markiertes 
Psfl-Fragment des cpcR1-Gens mit einer Grfide von 2,4 kb eingesetzt. Als 
Positivkontrolle fur die Hybridisierung diente das Plasmid pGC1, welches die 
cpcRVcDNA enthalt. 

Fig. 5: Northern-Hybridisierung mit Gesamt-RNA der A. cA?/ysogen(//n-Stamme 
ATCC 14553 (Spur1), A3/2 (Spur2) und Ac1 (Spur3). Als Sonde wurde ein 
radioaktiv-markiertes Ps/I-Fragment des cpcR1-Gens mit einer GroSe von 2,4 kb 
eingesetzt. 

Fig. 6: Schematische Darstellung der im ONE-HYBRID-System eingesetzten 
Proteine und der fS-Galaktosidase-Aktivitat der entsprechenden 
Hefetransformanten. Die f^-Galaktosidase-Aktivitat wurde aus mindestens drei 
Experimenten ermittelt. Wichtige Abkiirzungen: AD: transkriptionsaktivierende 
DomSne des GAL4-Proteins. DBD: DNA-Bindedomane, DIM: Dimerisationsdomane, 
DIM1/2: Deletionskonstrukte des cpcR1-Gens, U (^-Gal: U l^-Galaktosidase pro mg 
Protein. Alle weiteren Bezeichnungen entsprechen den Anmerkungen zu Figur 3. 
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Fig. 7: Reportergenanalyse von TWO-HYBRID Experimenten mit dem CPCR1- 
Protein und deletierten Derivaten des CPCR1 -Proteins. A) Schematische 
Darstellung der Hefestamme mit den jeweiligen Proteinen. B), C) und D) 
Photographien von Histidin-Selektionsplatten. Interaktionen der untersuchten 
Proteine fuhren in Hefetransformanten zu einer Expression des H/S3-Gens, die den 
Hefezelien das Wachstum ermoglicht. Die Selektionsplatten enthalten kein Histidin, 
Leucin und Urazil, aber 6 mM 3-AminotriazoL Abkurzungen: AD: aktivierende 
DomSne. BD: DNA-Bindedomane. Schematische Darstellung der Proteine siehe 
Figur 6. 
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Tabellen 



Tab. 1: Exemplarische Auswahl von Transkriptionsfaktoren bei Hyphenpilzen. 
Abkurzungen: bZlP: basic Leucin-Zipper, bHLH: basic Helix-Loop-Helix, 
Transfaktor: transaktivierender Faktor 



Organismus 


Trans- 
faktor 


Klasse 


Binde-Sequenz 
im Promotor 


regulierte Gene 


Referenz 


Aspergillus 
flavus 


AfIR 


C6- 

Zinkfinger 


TTAGGCCTAA 
(SEQ ID NO.: 2) 


Aflatoxin-Bio- 
synthesegene 


Payne et al. 
1993 


Aspergillus 
nidulans 


AREA 


C2/C2- 
Zinkfinger 


GATA-Elemente 


mehr als 100 
Strukturgene 
des N2-Meta- 
bolismus 


Kudia et al. 
1990 


Neurospora 
crassa 


CYS3 


bZIP 


ATGACGTCAT 
(SEQ ID NO.: 3) 


cys13 und 
cys14 


Fu et al. 1989 




NUC-1 


bHLH 


CACGTG 


phoA-^, pho5^ 
und p/?o2+ 


Kang und 

Metzenberg 

1990 


Per)icillium 
chrysoger)um 


Pace 


C2/C2- 
Zinkfinger 


GCCAAG 


pcbABIpcbC, 
pH-Regulation 


Haas und 
Marzluff 1995 



BNSDOCID: <WQ 9931244A1 l_> 



wo 99/31244 



PCT/EP98/07971 



32 



Tab. 2: Monomere Teilsequenzen von Oligonukleotiden, die im ONE-HYBRID- 
SYSTEM eingesetzt wurden. Die Sequenz BSII entspricht dem Bereich von -447 bis 
-423 des pc/)AB/pci)C-Promotors von A. chrysogenum. Die mutierten 
Oligonukleotide BSIIm1-3 wurden zur Bestimmung der Bindesequenz des CPCR1- 
Proteins eingesetzt. Die von der Ausgangssequenz abweichenden Nukieotide sind 
in Fettdruck angegeben. Neben den Ergebnissen der Reportergenanalysen ist auch 
die Konsensus-Sequenz der Bindeslellen des humanen RFX1 -Proteins angegeben. 
Unterstrichen sind solche Nukieotide innerhalb der Sequenzen, die an der Bildung 
eines Palindroms beteiligt sein konnten. 



Oligonukleotid \ Sequenz 


in vivo-Nachweis der lacZ- 






i 

! 
t 




Reportergenaktivi ta t 


BSII 




j 






(SBQ ID 


NO. : 


4) 

5) \ 


5 ' GTTGCCGGGCCAATCCCTGAGCTT 3 ' 


+ 


(SEQ ID 


NO. : 


CAACGGCCCGGTTAGGGACTCGAA 




BSIIml 




1 

1 






(SEQ ID 


NO. : 


6) 

I 


5' GTTGCCGGGGGTTACCCTGAGCTT3' 




(SEQ ID 


NO. : 


7) 


CAACGGCCCCCAATGGGACTCGAA 




BSIIm2 










(SEQ ID 


NO. : 


8) 


5' GTTGCCGGGCGTATCCCTGAGCTT3' 


+ 


(SEQ ID 


NO. : 


9) 


CAACGGCCCGCATAGGGACTCGAA 




BSIImS 










(SEQ ID 


NO, : 


10) 


5' CAACCCGGGCCAATCCCTGAGCTT3' 




(SEQ ID 


NO. ; 


11) 


1 GTT6GGCCCGGTTAGGGACTCGAA 




RFXl-consensus 






(SEQ ID 


NO. : 


56) 


1 5'NNGTNRCCRGYAACNN3' 
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Tab. 4: Ubersicht uber die verwendeten Hefeplasmide. Der Teil A der Tabelle 
enthalt Hefeplasmide mit Integrationen der in Tabelle 3 aufgefuhrten 
Oligonukleotide. Es handelt sich um integrative Hefeplasmide. Der Teil B der 
Tabelle enthalt Hefe-Expressionsplasmide, welche in die erzeugten Hefestammen 
transformiert wurden und dort als autonom replizierende Plasmide vorliegen. 





Plasmid 


Ausgangsvektor 


integherte 
Oligonukleotide 


Referenz j 




pHlSi 






Clontech 




pHISi-BSII 


pHISi 


BSII 


diese Arbeit 1 




pHISi-BSilm1 


pHlSi 


BSIIml 


diese Arbeit 1 




pHISi-BSIIm2 


pHISi 


BSilm2 


diese Arbeit | 




pHISi-BSIIm3 


pHISi 


BSIImS 


diese Arbeit 1 




pLACZi 






Clontech 1 




pLACZi-BSa 


pLACZi 


BSII 


diese Arbeit 1 




pLACZi-BSIimI 


pLACZi 


BSIIml 


diese Arbeit 1 




pLACZi-BSIInn2 


pLACZi 


BSIIm2 


diese Arbeit | 




pLACZi-BSIImS 


pLACZi 


BSIImS 


diese Arbeit 1 


B 


Plasmid 


Ausgangsvektor 


Charakteristika 


Referenz \ 




pGAD424 




Klonierungsvektor fur 
cDNA-Bank. GAL4- 
Aktivierungsdomane 


Clontech 




pGCI 


PGAD424 


cDNA-lnsert: cpcR^- 
Gen in EcoRI/SamHI- 
Schnittstelle 


diese Arbeit 




pGC1ADiM1 


pGC1 


Deletion bp 1220- 
2380 des cpcR1-Gens 


diese Arbeit 
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Tab. 5: Ubersicht uber die verwendeten Hefestamme. Die transgenen Hefestamme 
wurden durch die Transformation mit integrativen und/oder frei replizierenden 
Hefepiasmiden (siehe Tabelle 4) erzeugt. 



Stamm 


im Genom 
integrierte Plasmide 


autonom replizierende 
Plasmide 


Referenz 


YM4271 






Ciontech 


HISLACZ-BSil 


pHISi-BSil und 
pLACZi-BSlI 


PGAD424 
pGC1 

PGC1ADIM1 


diese Arbeit 


HlS-BSIIm1 


pHISi-BSIIm1 


pGAD424 
pGC1 


diese Arbeit 


HIS-BSIIm2 


pHISi-BSItm2 


pGAD424 
pGCI 


diese Arbeit 


HiS-BSIIm3 


pHISi-BSIim3 


pGAD424 
pGC1 


diese Arbeit 


LACZ-BSIIm1 


pLACZi-BSIimI 


pGAD424 
pGC1 


diese Arbeit 


LACZ-BSIIm2 


pLACZi-BSIim2 


pGAD424 
pGC1 


diese Arbeit 


LACZ-BSIIm3 


pLACZi-BSIImS 


pGAD424 
pGC1 


diese Arbeit 
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Tab. 6: DNA-Sequenz des isolierten cDNA-Klons (cpcR1 ) von Acremonium 
chrysogenum. Die angegebene Sequenz umfaBt 2546 bp (SEQ ID NO.: 20) und ist 
als einzelstrangiges, linearen DNA-Molekul in 5'-3'-Rlchtung dargestellt. 



10 20 30 40 50 60 

TCCAATATGC CTGCTATGTA CGGACAAGGG TGGTCATCAT CGTTTTCCCA GCAGAACCAC 

70 80 90 100 110 120 

GCCGGATATT CCACGCAGCC GCCGCAGCCG AGCCAGCAAG GACAGACATC GCAGATCCTC 

130 140 150 160 170 180 

CTTCTGCAGC AAGCAAGCAA CCCCGATGCG GCATCAAATC ATTTCCCTAT GAACGGCATG 

190 200 210 220 230 240 

AACGGCCACC CAATGGAATC CCAATTTCAT GCTCACCCGA TGCCAGCACA ACACCCGATA 

250 260 270 280 290 300 

CAACACTCGC AGCCTCACCT ACACCAGATG CATGCTCAGC ATCAAATGCC GGCCCATGCG 

310 320 330 340 350 360 

TTGAACCCAC ACACCTGGGC CAACGGAGAG AGCCAATCTG GAATGGATCA AACCGGTGAT 

370 380 390 400 410 420 

GCCCTGAAGG ACAATGCGAA TGGTCTCAAA AAGGGAAAGT CTAAGAGGAG GTCGAATGCC 

430 440 450 460 470 480 

AACAATGACG GCGAGATGAA GGAGCTTTTC GAGAGCAACC GCCACAAGTC GTTGGAGGAG 

490 500 510 520 530 540 

ATTGTTCAGG ATGTCAGGGG CAACGAGCGC GGTCCCAACG CAGAGCGCAA ACGTCAACTA 

550 560 570 580 590 600 

TATGCCATGC TCTGGCTCAA CTCAGCGTGC GTGGAAAGCA AGAACTCGAT CCCACGCGGC 

610 620 630 640 650 660 

CGGGTGTATC ACACTTATGC CTCAAAATGT ACCGACAGCA GAGTCGTAGT TCTCAACCCT 

670 680 690 700 710 720 

GCTAGTTTCG GGAAGTTGGT GCGAGTCGTC TTCCCATCCA TCAAAACCCG ACGACTTGGA 

730 740 750 760 770 780 

GTCCGGGGCG AGTCAAAGTA TCACTATTGC AACTTTCAAC TCCGTGATCC GCCACCGCCC 

790 800 810 820 830 840 

GAGGTGAGCG GGCTGCGAGA CGCTAGCGTT CCCGCTCCCG AAGAGGCAGC TAAGGGGGAG 

850 860 870 880 890 900 

GAGTTTGACT TCAACACACC GCCGAACCAG CAAAATGACG TCAAAGGAGC CAGTCGTTTA 

910 920 930 940 950 960 

CCATCGCCGG AGGATGCTTC TCATCCACCG GTCTCCCGCG CCACATCACG GACAAGCCAT 

970 980 990 1000 1010 1020 

G6ATTGGGTT CGCACAGCCG TTACATTGTT CCGCAGCCGC GGCGACTGAA ATCGGGATGG 

1030 1040 1050 1060 1070 1080 
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GCTGGGGGCA TCTGCGCAAC GTCCAAGACG CGCATCAAGC TCCGGGTCGC AACAGAGGCG 

1090 1100 1110 1120 1130 1140 

GAAACGAAAT TCGATTGGGA CGAGCCACTG GTGTTGCCGC CGATCGACCC GTTCCTGCCG 

1150 1160 1170 1180 1190 1200 

CCGCACACAG ATAAGGACGC GGCCGCCTCG CTGGTGGCCC TGTACCGCGC GCAGTTGACA 

1210 1220 1230 1240 1250 1260 

TCCCTCGCTG AGGCCTTCCG ATACATCAGG GACAAGAGCT TTTTCCACCT GTACACGTCC 

1270 1280 1290 1300 1310 1320 

TTCCACGGCA CATTGACGAT GCCTGTACAG AAGCTCTTTG CGCATCCGAG CATTGCTCCT 

1330 1340 1350 1360 1370 1380 

TGGATCGAGG AGTGCGACCT TGTTCTGTAC CAGCGGCTGA CCAAATTCGC CTTCACCATG 

1390 1400 1410 1420 1430 1440 

TCGCTCGTGG TGGTGCCTAA TGTGTATCTC AACCGGATGC GGTCCATCGC CGACCGTCTC 

1450 1460 1470 1480 1490 1500 

GTGCCGCACA TTGTGGACGT GTTCGGCGGG CATCCTGAGC ATGTGGTGCA AGCCAAGGCG 

1510 9 1520 1530 1540 1550 1560 

GGTCCGGCGG CCATCTTCGT AGGCATCCTG GAGCGGATGA CGCGTGTGAA CAAGACGGCG 

1570 1580 1590 1600 1610 1620 

CACGCGGCGG CCAGACCAGT GGCGTTGGAC GCCAACAGGG ACCAGATGTA CGCGGATTGG 

1630 1640 1650 1660 1670 1680 

CTGGAACTGG TCAACGCGCG CAAGATTGCC GAGTGCGTGC CGACGCGGGG AATGGACGAT 

1690 1700 1710 1720 1730 1740 

GTGGCGGAGC TACTTGTCAG GGAGATGCGG TATCTCGTGG ACCCCAAGAA CTATATTCCG 

1750 1760 1770 1780 1790 1800 

GATGACGAGA CTTCGAATGC CGATGCTGGA GGGGCCCGGT CACCGTTTGC CGTCAACCGA 

1810 1820 1830 1840 1850 1860 

TGGCGGGACT TTCTGATGAG TCTGCCCGGC AAGTTCCCGT ATGCGTCACA CGAAGACATT 

1870 1880 1890 1900 1910 1920 

GTTTGGTGCG TGGAGAGGGT GGGGACGGCG ATTGTGAGGG AGCTCACCTT GCAAGGGGGC 

1930 1940 1950 1960 1970 1980 

ACCAGCTTCA CAACGTGGTG GTCTATCAAG ACGTTCCTCG ACGAGGAGAT TATGTACCTG 

1990 2000 2010 2020 2030 2040 

GCCGAGGTTG GCGGGCTCAT GCATACGAAG AGCCTGCGCG ATGAGCCGTC AAGGCAGCAA 

2050 2060 2070 2080 2090 2100 

GCGACAACGG TCGTGACGGA AAGAGGCCAA AAAGGGGCCA CAGCGGACGA CGACGGTGAG 

2110 2120 2130 2140 2150 2160 

GTGGTGATGG GCGACGCAGG TCAGGAGGAA CCGATGGCGG TGGCGGCGTC GCCGGTGCAC 

2170 2180 2190 2200 2210 2220 

ACAGACCGGG CGCCATTCCC ACCGAAACAG GGAGATGCGG CCAACATGGG CGACGCGGCA 



2230 



2240 2250 



2260 2270 



2280 
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AGTGATGCGC ACGATGACAG TGGGATAGGG ATCCGGACCC CCGAGACGGA CTTTCCGGTG 

2290 2300 2310 2320 2330 2340 

GACAAGTTTG GACTCCATGA GGCGGAGGCG GGGGTCACAG AACTAGCCTA CGAAGGGTTG 

2350 2360 2370 2380 2390 2400 

GATCGAGAAT GGGCGGCTCC TGCATGACGA GGCCTGACGA AGGCACGAAG AGATGAACAG 

2410 2420 2430 2440 2450 2460 

CACGTGTTGG ATTAACGGTA TATCCCGGGG TTCTGGTTAT GGGTCCGGAG TAGGTCATGT 

2470 2480 2490 2500 2510 2520 

CACTAAGGGG TCTATTGGGT AAATGTGATG TTGGGTCACT CTTCGAATTA TACCTCATTA 

2530 2540 2550 2560 2570 2580 

ATGCCACTAC TGCCTGATGA TAAAAA 



Tab. 7: AminosSuresequenz, abgeleitet vom ORF 786 aus dem cDNA-Klon (cpcR1) 
von Acremonium chrysogenum, Der offenen Leserahmen kodiert fur 786 
Aminosauren (SEQ ID NO.: 21). 

10 20 
Met Arg Ala Asp Glu Pro Ala Ala Ala He Gin Ala Ser Ser Ala Ala Met Arg Pro Gin 

30 40 
Ser Arg Ala Ser Thr Ser Ser Thr His Ser Ala Ala Thr Gin Pro Thr Thr Asp Ala His 

50 60 
Asp Tyr Ser Asn Met Pro Ala Met Tyr Gly Gin Gly Trp Ser Ser Ser Phe Ser Gin Gin 

70 80 
Asn His Ala Gly Tyr Ser Thr Gin Pro Pro Gin Pro Ser Gin Gin Gly Gin Thr Ser Gin 

90 100 
He Leu Leu Leu Gin Gin Ala Ser Asn Pro Asp Ala Ala Ser Asn His Phe Pro Met Asn 

110 120 
Gly Met Asn Gly His Pro Met Glu Ser Gin Phe His Ala His Pro Met Pro Ala Gin His 

130 140 
Pro He Gin His Ser Gin Pro His Leu His Gin Met His Ala Gin His Gin Met Pro Ala 

ISO 160 
His Ala Leu Asn Pro His Thr Trp Ala Asn Gly Glu Ser Gin Ser Gly Met Asp Gin Thr 

170 180 
Gly Asp Ala Leu Lys Asp Asn Ala Asn Gly Leu Lys Lys Gly Lys Ser Lys Arg Arg Ser 

190 200 
Asn Ala Asn Asn Asp Gly Glu Met Lys Glu Leu Phe Glu Ser Asn Arg His Lys Ser Leu 

210 220 
Glu Glu He Val Gin Asp Val Arg Gly Asn Glu Arg Gly Pro Asn Ala Glu Arg Lys Arg 

230 240 
Gin Leu Tyr Ala Met Leu Trp Leu Asn Ser Ala Cys Val Glu Ser Lys Asn Ser He Pro 

250 260 
Arg Gly Arg Val Tyr His Thr Tyr Ala Ser Lys Cys Thr Asp Asp Arg Val Val Val Leu 

270 280 
Asn Pro Ala Ser Phe Gly Lys Leu Val Arg Val Val Phe Pro Ser He Lys Thr Arg Arg 

290 300 
Leu Gly Val Arg Gly Glu Ser Lys Tyr His Tyr Cys Asn Phe Gin Leu Arg Asp Pro Pro 

310 320 
Pro Pro Glu Val Ser Gly Leu Arg Asp Ala Ser Val Pro Ala Pro Glu Glu Ala Ala Lys 

330 340 
Gly Glu Glu Phe Asp Phe Asn Thr Pro Pro Asn Gin Gin Asn Asp Val Lys Gly Ala Ser 

350 360 
Arg Leu Pro Ser Pro Glu Asp Ala Ser His Pro Pro Val Ser Arg Ala Thr Ser Arg Thr 

370 380 
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Ser 


His 


Gly 


Leu 


Gly 


Trp 


Ala 


Gly 


Glu 


Ala 


Glu 


Thr 


Leu 


Pro 


Pro 


His 


Leu 


Thr 


Ser 


Leu 


Thr 


Ser 


Phe 


His 


Ala 


Pro 


Trp 


He 


Thr 


Met 


Ser 


Leu 


Arg 


Leu 


Val 


Pro 


Lys 


Ala 


Gly Pro 


Thr 


Ala 


His 


Ala 


Asp 


Trp 


Leu 


Glu 


Asp 


Asp 


Val 


Ala 


He 


Pro 


Asp Asp 


Asn 


Arg 


Trp Arg 


Asp 


He 


Val 


Trp 


Gly 


Gly 


Thr 


Ser 


Tyr 


Leu 


Ala 


Glu 


Gin 


Gin 


Ala 


Thr 


Gly 


Glu 


Val 


Val 


Val 


His 


Thr 


Asp 


Ala 


Ala 


Ser 


Asp 


Pro 


Val 


Asp 


Lys 


Gly 


Leu 


Asp Arg 



Gly Ser His Ser 
Gly He Cys Ala 
Lys Phe Asp Trp 
Thr Asp Lys Asp 
Ala Glu Ala Phe 
Gly Thr Leu Thr 
Glu Glu Cys Asp 
Val Val Val Pro 
His He Val Asp 
Ala Ala He Phe 
Ala Ala Arg Pro 
Leu Val Asn Ala 
Glu Leu Leu Val 
Glu Thr Ser Asn 
Asp Phe Leu Met 
Cys Val Glu Arg 
Phe Thr Thr Trp 
Val Gly Gly Leu 
Thr Val Val Thr 
Met Gly Asp Ala 
Arg Ala Pro Phe 
Ala His Asp Asp 
Phe Gly Leu His 
Glu Trp Ala Ala 











Arg 


Tyr 


He 


Val 




390 






Thr 


Ser 


Lys 


Thr 




410 






Asp 


Glu 


Pro 


Leu 




430 






Ala 


Ala 


Ala 


Ser 




450 






Arg 


Tyr 


He 


Arg 




470 






Met 


Pro 


Val 


Gin 




490 






Leu 


Val 


Leu 


Tyr 




510 






Asn 


Val 


Tyr 


Leu 




530 






Val 


Phe 


Gly Gly 




550 






Val 


Gly 


He 


Leu 




570 






Val 


Ala 


Leu 


Asp 




590 






Arg 


Lys 


He 


Ala 




610 






Arg 


Glu 


Met 


Arg 




630 






Ala 


Asp 


Ala 


Gly 




650 






Ser 


Leu 


Pro 


Gly 




670 




Val 


Gly 


Thr 


Ala 




690 






Trp 


Ser 


He 


Lys 




710 






Met 


His 


Thr 


Lys 




730 






Glu 


Arg 


Gly 


Gin 




750 






Gly 


Gin 


Glu 


Glu 




770 






Pro 


Pro 


Lys 


Gin 




790 




Ser 


Gly 


He 


Gly 




810 






Glu 


Ala 


Glu 


Ala 




630 






Pro 


Ala 







Pro Gin Pro Arg 
Arg He Lys Leu 
Val Leu Pro Pro 
Leu Val Ala Leu 
Asp Lys Ser Phe 
Lys Leu Phe Ala 
Gin Arg Leu Thr 
Asn Arg Met Arg 
His Pro Glu His 
Glu Arg Met Thr 
Ala Asn Arg Asp 
Glu Cys Val Pro 
Tyr Leu Val Asp 
Gly Ala Arg Ser 
Lys Phe Pro Tyr 
He Val Arg Glu 
Thr Phe Leu Asp 
Ser Leu Arg Asp 
Lys Gly Ala Thr 
Pro Met Ala Val 
Gly His Ala Ala 
He Arg Thr Pro 
Gly Val Thr Glu 



Arg Leu Lys Ser 

400 

Arg Val Ala Thr 

420 

He Asp Pro Phe 

440 

Tyr Arg Ala Gin 

460 

Phe His Leu Tyr 

460 

His Pro Ser He 

500 

Lys Phe Ala Phe 

520 

Ser He Ala Asp 

540 

Val Val Gin Ala 

560 

Arg Val Asn Lys 

580 

Gin Met Tyr Ala 

600 

Thr Arg Gly Met 

620 

Pro Lys Asn Tyr 

640 

Pro Phe Ala Val 

660 

Ala Ser His Glu 

680 

Leu Thr Leu Gin 

700 

Glu Glu He Met 

720 

Glu Pro Ser Arg 

740 

Ala Asp Asp Asp 

760 

Ala Ala Ser Pro 

780 

Asn Met Gly Asp 

800 

Glu Thr Asp Phe 

820 

Leu Ala Tyr Glu 

840 



BNSDOCID: <WO_9931244A1 J_> 



wo 99/31244 



40 



PCT/EP98/07971 



CO 

o 

c 

E 
< 

o 

CO 



£ 
c 

O 

I 

0) 



0) 



O) 

c 
'S 
c 

(D 
C 

E 
o 

0> 



CD 
< 

Q 

T3 

O 

O) 

N 
C 

a> 



0) 
CO 



CO 

o 
c 

E 

< 

00 

• 

(0 



CM 

c 

0) 

c 

T3 

C 
(0 



CO 



0 
c 

0) 

5) o 



CO 

o 

CL 
0) 

o 

CO 

o 

(0 

c 

0) 



c 



CO 
t 

CO 
3 
CO 

c 
0 

CO 

c 
o 



0) 

o 
o 

0) 



0) 
X 

o 

CD 

0) 
3 
CQ 



CNi 
CN 



a 

LU 

0) 52. 



<D P iJ 

- - O 



0. 

I 

o 
o 

§ 

C 

§■ 

.2 

c 
o 

g 

o 



tr 
o 

Q. 
O 



0) 

4:: 
3 
CO 

c 
S 

3 
:(D 
CO 
O 

c 

E 
< 

a> 
c 

Q) 



o: 

.a 

s 

o 

CO 

I 

CD 

o 
o 

CO 

CO 

• • 

X 

u. 

cr: 

o 

CO 



CO 
CM 



00 



0) 

o 

a. 

I 

< 

CO 

I 

CO 
Q> 

I 

s 

CD 
O 

o 

CD 

o 

CO 



C 0) ^ 

3 •= ^ 

■o o < 

T5 2 CO 

CO > CO 



0) 

c 
*5 
c 
q3 
E 
E 

JO 



CM 



O ^ 



a 

iU 
CO 



CM 



CM 



9 ^ 
o 

ai 

CO 



0) 

o 
>< 

UL 

QC 

CO 

C 

S 

CO 

o 



CC 

CO 



CM 



0) 

o> 



O 
111 

CO 



S 

0. 



0) 
CD 



CQ 

m 



O CO 



Q ^ 
a> 



(O 

E 



m § o: ^ ^ 

r- i-q i4 H 

fn H i4 h3 

2 O C!) O 

ULUL 



1-3 H 




u m ri % 




K tc3 H 0^ 

H H ►a 

CO CO Q O 

Di Qi Cb S 



in 



H 

M4 

€0 



cn 



K H €0 n 



H 

s 

H 





u M or 



S O 1^ ^ 



0« v-f r4 

OM § S 

u CO o; oi 

o a u n 

< CO CO m 

d CO ^ 



c 
o 
o 



BNSOOCtD: <WO_9931244AlJ > 



wo 99/31244 



41 



PCT/EP98/07971 



c 

0) 



E 
c 

0) 
X 

o 

CD 
CO 

E 

CO 
I 

X 

LL 

k— 
0) 



0) 



CD 

c 

c 
c 

:C0 

E 
o 



(0 

<A 

CD 

E 

b 

0) 



O 

'5 

N 
C 
(D 

or 
0) 
CO 

3 

:€D 
CO 
O 
C 

1 
< 



CO 



E 
.2 
c 
o 

a • 

o 

Q. 

O 
o 

< 

c 

Q) 
O) 

C 

y 

jO 
< 

c 

0) 



:C0 
CO 

o 
c 

• mm 

I 

c 

<D 
C 
CD 

•o 



o 

CO 

Q) 
> 

CM 

1 

CD 
C 

o 



CO 
o 

Gl 

0) 

"5 



& 

:C0 
(O 
O 

c 

E 
< 

0) 

o 

o> .2 



c 

CD 



O 

z 
9 

o 

LU 
CO 



CO 



< 

-o 

E 
o 
a 

CO 

o 

I 

8 

CO 



o 
o 

CO 



< 

CO 



CO 
CM 



O 
LU 
CO 

c 

o 
a. 

o 

Q. 
O 

§ 



CM 



CM 
< 



0) 

o 

i 

>< 

LL 



3 g 
O to 

o 

3: 



X 

LL 

q: 

CO 



CO LU 



CO 
CM 



CO B 
- o 



B Q a 



X 

LL 
€C 

CD 
CO 

a? 

CD 
O 

CO 
(D 

I 

e 

CD 
O 

o 

CO 
00 



a: 

o 

S CO 

O CM 



0) 
X) 
(D 
C3> 
0) 
O) 

c 

CO 

B 

0) 
:9 
CD 

■g 

0) 



^ CO 
CD ^ 
CM C 
CD 

d W 



CO 



UJ 
0) 



CD 

E 



g 
'co 

CO 
CD 

o 
o 

CO 
CD 



CO 

c 

E 
E 

JS 



<3) 
CM 



O 
LU 
CO 




1 t 



ion 



H > 



3 S 



♦y; rn »yr n 
^ b H I 




O 2 S Ql 
> CO H f< 



U « 

CM 3 

a CO 

u a u m 

f< CO to as 

iH CM m ^ 




c 
o 
u 




3 X ^ 



u c> 



H »^ 



CO CO 




H > 



) U CO 



10 



] CO < 



CM lid. 



CO CO 

0* Oi 



J CO U 



U4 U* 



7-1 CM cn 



9931244A1 I > 



wo 99/31244 



42 



PCT/EP98/0797I 



m 

00 

°? CM 
CO 



o 

JQ 
O 
CL 
■> 

CO 



0) 

c 
o 

E 

(0 
CO 



CN 
O 



in 
O 
Ol 



in 




in 




CO 




GO 




O) 


CsJ 










CNJ 




to 






15 




« 






t 


0) 


1 






son 


o 


con 1 


CM 

o 


E 


vi 


E 


CO 


CD 


O 


C3 


O 


CO 


a. 


CO 


Q. 



in 




m 




00 




00 






CN 


CJ> 








CM 




\U 




CO 


15 


TT 


• 

TO 






1 


0) 


1 






son 


CM 
O 


coo 1 


CM 
O 


E 


CO 


E 


CO 


(0 


O 


(D 


O 


CO 


a 


CO 


CL 



Nl 
C 
0) 

Q) 



< 
0) 



CO 



CD 

c 



CD 



O 

Q) 



X3 
CD 



< 

CP 



CD 
I- 



.fc CD 



CD 



c 

CD 

c 

E 
o 

0) 

0 

-Q 
CD 
Oi 
C 

< 

T3 



C 

o 

CD 
> 



(D 
N 
C 
CD 

cr 

CD 
CO 

•a 
o 

CD 



a 

CO 



O 
id 

o 

Q. 



c 

< 

JD 



CO 
CO 
CM 

I 

CO 

o 



CJ> 



CD 

"S 

® 
c 
c 

CD 



O) 
Q) 



CD 

c in 

0) CO 

C3> T 

3 

CD CO 

o 

CO Q. 



CD 



CD 

CD 

CD 
C 

c 

(D 



0) 
CD 

CD 

o> 

CM 

I 

CO 
CM 



CO 
CO 
CM 

• 

CO 

o 
a. 



(O 

O 
0. 



Q> CD 

c m 

CD CD 
0) 

CD (/) 

±z O 

CO Q. 



CD 
CJ> 

CM 
I 

GO 
CM 

(O 

o 
Gl 



CO 
CO 
CM 

f 

N. 

CO 
O 
CL 



CD 

"5 

CD 
C 

c 

CD 



CD 
(D 

■g 

CD 



0) o> 

c in 

CD m 

O) »^ 
0) 



CD 

55 



CO 

o 

CL 



CD 
CJ> 

CM 
t 

CO 
CM 

(O 

o 

CL 



• 




CO 


CM 


E 






* 


u. 




CD 


CD 


CO 




3 




U. 


CL 


c 


X3 


o 


CM 







CO 
CO 
CM 

I 

CO 

o 



a> 



CD 

0) 

(D 

c 
c 

CD 



O) 
CD 

0) 



a> cn 

CD CD 

CD CO 

i: O 

CO CL 



CD 

cn 

CM 

I 

CO 
CM 
h-. 

CO 
O 
CL 



• 

CL 


CD 


CO 


CM 


E 




3 


« 


L_ 




CD 


CD 


CO 




3 




U. 


CL 


c 




o 


CM 


> 





CO 
CO 
CM 

I 

CO 

o 

CL 



CJ) 
C^ 



CD 

cS 

CD 

c 
c 

(D 



& 

"55 

CD 



CD 0> 

c in 

CD CD 

CD CO 

-t: O 

CO CL 



CD 



CM 
CL 



CO 



CM 
CL 



CM 
CM 



BNSDCX^ID: <WO_9931244A1 J_> 



wo 99/3 1 244 43 PCT/EP98/0797 1 



10 in If) 10 

CO CO ' GO 00 

Csi ^CNJ ^CNJ ^CNJ 

CD .CO .CD . <D 

CD^ (Dt- CQ^ (0^ 

aJ'A "St^- ©t^ 0)^ 

O 5o So 5o So 

S ozi oz: ozi oz^ 

QL Eto E(0 Eo) Ec/j 

(DO coo CDO (DO 

ro coa. coo. coo. coa 



o ^ 



< 

0) 



i3 

CO 



.E CO 



O 

0) 



jO 
CO 



a 

o 

•o ■ 

(0 
0> 



Q. CD 

■i 

CO « 



c 
o 



X2 
CM 



E 




0 


E 




3 




CN 


3 

• MS 


E 


c 


E 




c 


0 


3 


• 


0 


3 




c 


CO 

H- 


E 


c 


crei 


(D 

O) 

0 


crei 


Q> 

CD 

0 


< 


CO 


CL 


< 


(/) 


c 






c 




0 




0 


0 




> 


0 


CD 


> 


u 



o 

CM 



CO 



o. 



o 
E 

b 
< 



E 
3 
c 

0) 

o 

CO 



O 

CM 



CO 



CD 



cn 
(J) 



CJ> 



O 

XI 

o 
a 



CO 
0) 

c 

0 



CO 
CO 
CM 

i 

O 



(0 CO 
I 



0) 

c 
c 

(D 



CO 

O 



CO 
0) 

c 
c 



CO 
CO 
CM 

t 

(O 

o 

Ol 



CO 

(D 

0) 
C 

c 

0) 



CO 
CO 
CM 



(A 

o 

0. 



0) 

c 

< 

(0 



CD 

C3> 

CM 
I 

GO 
CM 

(/) 
O 



CD 

JD 

Q) 

■g 

0) 



0) 

c 

0) 
0) 

CO (0 
±5 O 

CO Q. 



in 
9 



0) 

:9 
(D 
T3 



CD 

C3> 

CM 
I 

CO 
CM 
N. 

(/) 
O 
0. 



0) C7> 

c tn 

<D CP 

eg 

fo ui 

i= o 

CO a 



CD 

CN 

I 

00 
CM 

(/> 
O 
0. 



Oi 
k. 

0 

jQ 

0) 

-g 

X 

c 

0) 

a> 

CO 



C3) 

in 

CD 

1 



(O 

o 

Q. 



CD 

a> 

CM 
I 

CO 
CM 

(0 

o 
Cl 



CD 

0) 
"D 

X 

0) C3^ 

c in 

Q) CD 
O) • 

02 

{0 CO 

i= o 

CO 0. 



CD 

(jy 

CM 
I 

CO 
CM 

(O 

o 

CL 



o 

Q) 



CO 
CM 



CO 
Q. 



CM 
CO 



CO 
CO 

CL 



BNSDOCID: <WO_9931244AlJ_> 



wo 99/31244 



PCT/EP98/07971 



44 

Tab. 11: Die charakteristischen Klonierungsstellen der neun Vektoren und die 
davon abgeleiteten Restriktionsschnittstellen. welche fur Klonierungen geeignet 
sind. Zu beachten ist, dali sich die drei Klonierungsstellen nur durch ein bzw. zwei 
Basenpaare unterscheiden. 



1. Leseraster (Oligonukleotide Nr. 1+2) 

Hindlll Nrul EcoRI 
A 5' C ATG AAG CTT TCG CGA GAA TCC 3' (SEQ ID NO.: 30) pIR22,21,31 

3* TTC GAA AGC GCT CTT AAG 5' (SEQ ID NO.: 31) 



2. Leseraster (Oligonukleotide Nr. 3 + 4) 

B 5' C ATG UKA GCT TTC GCG AGA ATT C 3' (SEQ ID NO.: 32) pIR12,22,32 

3' GTT CGA AAG CGC TCT TAA G 5' (SEQ ID NO.: 33) 

3. Leseraster (Oligonukleotide Nr. 5 + 6) 

C 5' C ATG CTA AGC TTT CGC GAG AAT TC 3* (SEQ ID NO.: 34) pIR13,23,33 

3' GAT TCG AAA GCG CTC TTA AG 5* (SEQ ID NO.: 35) 
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Tab. 12: Ubergangssequenzen im Bereich der multiplen Klonierungsstelle 
(eingerahmt) in den angegebenen Expressionsvektoren. In den Sequenzen wurden 
solche Nukleotide unterstrichen, die gegenuber dem erstgenannten Plasmid 
verschieden sind. 

A. Vektoren ohne Signalsequenz 



plR11 

1. Leseraster 

Hindi! I Nrul EcoRI 



AAACCGTCACC 


ATG 


AAG 


CTT 


TCG 


CGA 


GAA 


TTC 


GGGTCGATCAGG 


{SEQ 


ID 


NO. : 


36) 


TTTGGCAGTGG 


TAC 


TTC 


GAA 


AGC 


GCT 


CTT 


AAG 


CCCAGCTAGTCC 


(SEQ 


ID 


NO. : 


37) 



plR12 

2. Leseraster 

AAACCGTCACC ATG d^A GCT 1 



TC GCG ASA ATT C 3GGTCGATCAGG (SEQ ID NO. : 38) 



TTTGGCAGTGG TAC GFT CGA ^AG CGC T-T TAA G CCCAGCTAGTCC (SEQ ID NO. : 39) 



plR13 

3. Leseraster 

AAACCGTCACC ATG 
TTTGGCAGTGG TAC 




TC GGGTCGATCAGG 
AG CCCAGCTAGTCC 



(SEQ ID NO. : 40) 
(SEQ ID NO. : 41) 
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B. Vektoren mit Signalsequenz aus Fusarium 



plR21 

1. Leseraster 

AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC 
TTTGGCAGTGG TAG GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG 



Hindlll Nrul 



EcoRI 



ATG 
TAC 



lAAG CTT 
TTC GAA 



TCG CGA 
AGC GCT 



GAA TTC GtGTCGATCAGG (SEQ ID NO.: 42) 
CTT AAG CtCAGCTAGTCC (SEQ ID NO.: 43) 



plR22 

2. Leseraster 

AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC 
TTTGGCAGTGG TAC GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG 



ATG 

TAC a 



CPA 



GCT 
TT CGA 



Tire GCG WA ATT CpGGTCGATCAGG 
aKg CGC TICT TAA GCCCAGCTAGTCC 



(SEQ ID NO.: 44) 
(SEQ ID NO. : 45) 



piR23 

3. Leseraster 

AAACCGTCACC ATG CGT CTG TCC ATC ATC GCA GTC CTT CCC CTG GCC CTC GCC 
TTTGGCAGTGG TAC GCA GAC AGG TAG TAG CGT CAG GAA GGG GAC CGG GAG CGG 



ATG CI 
TAC 



G^r 



A AGC 
TGC 



TTT 



CGC 
GCG 



Qh2 



AAT TC 
TTA AG 



GGTCGATCAGG 
CCCAGCTAGTCC 



(SEQ ID NO. : 46) 
(SEQ ID NO. : 47) 
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C. Vektoren mit Signalsequenz aus Acremonium chrysogenum 
plR31 

1 . Leseraster 

AAACCGTCACC ATG GTC ACC CTC CGC CGC CTC GCC GTC CTC CTC GGC 
TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG 



Hindlll Nrul EcoRI 



GCC 


ATC 


CCC 


GCC 


GCC 


CTC 


GCC 


GCC 


ATG 


AAG 


CTT 


TCG 


CGA 


GAA 


TTC 


CGG 


TAG 


GGG 


CGG 


CGG 


GAG 


CGG 


CGG 


TAC 


TTC 


GAA 


AGC 


GCT 


CTT 


AAG 



GGGTCGATCAGG (SEQ ID NO.: 48) 



CCCAGCTAGTCC (SEQ ID NO.: 49) 



plR32 

2. Leseraster 

AAACCGTCACC ATG GTC ACC CTC CGC CGC CTC GCC GTC CTC CTC GGC GCC ATC CCC GDC 
TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG CGG TAG GGG CGG 



GCC CTC GCC GCC ATG 
CGG GAG CGG CGG TAC 



GTT 



GCT 
CGA 



TTC 

;^^G 



GCG Pi 
CGC 



GA ATT 
TAA 



CGGGTCGATCAGG (SEQ ID NO.: 50) 
G CCCAGCTAGTCC ( S EQ ID NO . : 51) 



plR33 

3. Leseraster 

AAACCGTCACC ATG GTC ACC CTC CGC CGC CTC GCC GTC CTC CTC GGC GCC ATC CCC GCC 
TTTGGCAGTGG TAC CAG TGG GAG GCG GCG GAG CGG CAG GAG GAG CCG CGG TAG GGG CGG 



GCC CTC GCC GCC ATG 
CGG GAG CGG CGG TAC 



CTlA AGC Titr CGC G^jG AAT TCfeGGTCGATCAGG (SEQ ID NO. : 52) 
G-PlT TGC a4a GCG Cljc TAA AG CCCAGCTAGTCC (SEQ ID NO. : 53) 
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Tabelle 13: DNA-Sequenz der genomischen Kopie des cpcR1-Gens von 
Acremonium chrysogenum (SEQ ID NO.: 57) 



10 20 30 40 50 60 

AGAATGAGAG TTATTACCTG GGAATCGTTC GTGCAGTGGT CCCAGCCACA TGCACAAGGT 

70 80 90 100 110 120 

TGAGAGGTTC GCAGCAGGGA TGCGGGGCAA CGCCAGGAAC TTTGACAAAT GAGGGTGCGT 

130 140 150 160 170 180 

TCCTGCTTAC CTAAGTTGGC TCGTGCCCAC AAACCGGGAG TCGTTTCTCC TCCCGTTGGC 

190 200 210 220 230 240 

CTCGCAACAG AAAAACACAC CGACCACAAA CAACAGCCCG CCTTCCGTCC ATCGAGCAAC 

250 260 270 280 290 300 

CACTTGCCTA GCCTTGCCCG ACGCGGGTCA TCCAGACAGA CCTTGCGCGG AACCGGACGC 

310 320 330 340 350 360 

ATCACGTCAC ATTTTTCTTT ATTTCTTTTC CTCGACAACG ACACGCCTTC AGCGCGCCCT 

370 380 390 400 410 420 

GCGCACCCAT CGCTGTCGCG CTGCTGCGGA GCAGTGTTTG TTGTGAACTG CGACCGACCC 

430 440 450 460 470 480 

CCGACAGGCA GCTTTCCGTG GAAGTGGACC TCCACCAAAA CATCCCCATC ATGGACCAAG 

490 500 510 520 530 540 

GTTTGTCCCA CCCTGCTCCG ATGGCAGATG ACTTACTAGA ACGGCTTGTT GACAATGCGA 

550 560 570 580 590 600 

GCAGACGAGC CGGCCGCCGC GATTCAGGCG TCTTCCGCCG CGATGCGGCC GCAATCTAGG 

610 620 630 640 650 660 

GCCTCGACCT CCTCGACACA CAGCGCCGCG ACGCAACCCA CCACAGATGC CCATGATTAC 

670 680 690 700 710 720 

TCCAATATGC CTGCTATGTA CGGACAAGGG TGGTCATCAT CGTTTTCCCA GCAGAACCAC 
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730 740 750 760 770 780 

GCCGGATATT CCACGCAGCC GCCGCAGCCG AGCCAGCAAG GACAGACATC GCAGATCCTC 



790 800 810 820 830 840 

CTTCTGCAGC AAGCAAGCAA CCCCGATGCG GCATCAAATC ATTTCCCTAT GAACGGCATG 



850 860 870 880 890 900 

AACGGCCACC CAATGGAATC CCAATTTCAT GCTCACCCGA TGCCAGCACA ACACCCGATA 



910 920 930 940 950 960 

CAACACTCGC AGCCTCACCT ACACCAGATG CATGCTCAGC ATCAAATGCC GGCCCATGCG 



970 980 990 1000 1010 1020 

TTGAACCCAC ACACCTGGGC CAACGGAGAG AGCCAATCTG GAATGGATCA AACCGGTGAT 



1030 1040 1050 1060 1070 1080 

GCCCTGAAGG ACAATGCGAA TGGTCTCAAA 7VAGGGAAAGT CTAAGAGGAG GTCGAATGCC 



1090 1100 1110 1120 1130 1140 

AACAATGACG GCGAGATGAA GGAGCTTTTC GAGAGCAACC GCCACAAGTC GTTGGAGGAG 



1150 1160 1170 1180 1190 1200 

ATTGTTCAGG ATGTCAGGGG CAACGAGCGC GGTCCCAACG CAGAGCGCAA ACGTCAACTA 



1210 1220 1230 1240 1250 1260 

TATGCCATGC TCTGGTAAGA ACGACAGAGA GACTGACCAG CGCTTCACGT TCACTGACAT 



1270 1280 1290 1300 1310 1320 

GCGACAGGCT CAACTCAGCG TGCGTGGAAA GCAAGAACTC GATCCCACGC GGCCGGGTGT 



1330 1340 1350 1360 1370 1380 

ATCACACTTA TGCCTCAAAA TGTACCGACG ACAGAGTCGT AGTTCTCAAC CCTGCTAGTT 



1390 1400 1410 1420 1430 1440 

TCGGGAAGTT GGTGCGAGTC GTCTTCCCAT CCATCAAAAC CCGACGACTT GGAGTCCGGG 



1450 1460 1470 1480 1490 1500 

GCGAGTCAAA GTATCACTAT TGCAACTTTC AACTCCGTGA TCCGCCACCG CCCGAGGTGA 



1510 1520 1530 1540 1550 1560 
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GCGGGCTGCG AGACGCTAGC GTTCCCGCTC CCGAAGAGGC AGCTAAGGGG GAGGAGTTTG 



1570 1580 1590 1600 1610 1620 

ACTTCAAGTA AGTACCTATT GACAGGATGA TGCTGTATGC GCCTCTAACG TGTACCCAGC 



1630 1640 1650 1660 1670 1680 

ACACCGCCGA ACCAGCAAAA TGACGTCAAA GGAGCCAGTC GTTTACCATC GCCGGAGGAT 

1690 1700 1710 1720 1730 1740 

GCTTCTCATC CACCGGTCTC CCGCGCCACA TCACGGACAA GCCATGGATT GGGTTCGCAC 

1750 1760 1770 1780 1790 1800 

AGCCGTTACA TTGTTCCGCA GCCGCGGCGA CTGAAATCGG GATGGGCTGG GGGCATCTGC 

1810 1820 1830 1840 1850 1860 

GCAACGTCCA AGACGCGCAT CAAGCTCCGG GTCGCAACAG AGGCGGAAAC GAAATTCGAT 

1870 1880 1890 1900 1910 1920 

TGGGACGAGC CACTGGTGTT GCCGCCGATC GACCCGTTCC TGCCGCCGCA CACAGATAAG 

1930 1940 1950 1960 1970 1980 

GACGCGGCCG CCTCGCTGGT GGCCCTGTAC CGCGCGCAGT TGACATCCCT CGCTGAGGCC 

1990 2000 2010 2020 2030 2040 

TTCCGATACA TCAGGGACAA GAGCTTTTTC CACCTGTACA CGTCCTTCCA CGGCACATTG 

2050 2060 2070 2080 2090 2100 

ACGATGCCTG TACAGAAGCT CTTTGCGCAT CCGAGCATTG CTCCTTGGAT CGAGGAGTGC 

2110 2120 2130 2140 2150 2160 

GACCTTGTTC TGTACCAGCG GCTGACCAAA TTCGCCTTCA CCATGTCGCT CGTGGTGGTG 

2170 2180 2190 2200 2210 2220 

CCTAATGTGT ATCTCAACCG GATGCGGTCC ATCGCCGACC GTCTCGTGCC GCACATTGTG 

2230 2240 2250 2260 2270 2280 

GACGTGTTCG GCGGGCATCC TGAGCATGTG GTGCAAGCCA AGGCGGGTCC GGCGGCCATC 

2290 2300 2310 2320 2330 2340 

TTCGTAGGCA TCCTGGAGCG GATGACGCGT GTGAACAAGA CGGCGCACGC GGCGGCCAGA 
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2350 2360 2370 2380 2390 2400 

CCAGTGGCGT TGGACGCCAA CAGGGACCAG ATGTACGCGG ATTGGCTGGA ACTGGTCAAC 

2410 2420 2430 2440 2450 2460 

GCGCGCAAGA TTGCCGAGTG CGTGCCGACG CGGGGAATGG ACGATGTGGC GGAGCTACTT 

2470 2480 2490 2500 2510 2520 

GTCAGGGAGA TGCGGTATCT CGTGGACCCC AAGAACTATA TTCCGGATGA CGAGACTTCG 

2530 2540 2550 2560 2570 2580 

AATGCCGATG CTGGAGGGGC CCGGTCACCG TTTGCCGTCA ACCGATGGCG GGACTTTCTG 

2590 2600 2610 2620 2630 2640 

ATGAGTCTGC CCGGCAAGTT CCCGTATGCG TCACACGAAG ACATTGTTTG GTGCGTGGAG 

2650 2660 2670 2680 2690 2700 

AGGGTGGGGA CGGCGATTGT GAGGGAGCTC ACCTTGCAAG GGGGCACCAG CTTCACAACG 

2710 2720 2730 2740 2750 2760 

TGGTGGTCTA TCAAGACGTT CCTCGACGAG GAGATTATGT ACCTGGCCGA GGTTGGCGGG 

2770 2780 2790 2800 2810 2820 

CTCATGCATA CGAAGAGCCT GCGCGATGAG CCGTCAAGGC AGCAAGCGAC AACGGTCGTG 

2830 2840 2850 2860 2870 2880 

ACGGAAAGAG GCCAAAAAGG GGCCACAGCG GACGACGACG GTGAGGTGGT GATGGGCGAC 

2890 2900 2910 2920 2930 2940 

GCAGGTCAGG AGGAACCGAT GGCGGTGGCG GCGTCGCCGG TGCACACAGA CCGGGCGCCA 

2950 2960 2970 2980 2990 3000 

TTCCCACCGA AACAGGGACA TGCGGCCAAC ATGGGCGACG CGGCAAGTGA TGCGCACGAT 

3010 3020 3030 3040 3050 3060 

GACAGTGGGA TAGGGATCCG GACCCCCGAG ACGGACTTTC CGGTGGACAA GTTTGGACTC 

3070 3080 3090 3100 3110 3120 

CATGAGGCGG AGGCGGGGGT CACAGAACTA GCCTACGAAG GGTTGGATCG AG7VATGGGCG 

3130 3140 3150 3160 3170 3180 

GCTCCTGCAT GACGAGGCCT GACGAAGGCA CGAAGAGATG AACAGCACGT GTTGGATTAA 
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3190 3200 3210 3220 3230 3240 

CGGTATATCC CGGGGTTCTG GTTATGGGTC CGGAGTAGGT CATGTCACTA AGGGGTCTAT 



3250 3260 3270 3280 3290 3300 

TGGGTAAATG TGATGTTGGG TCACTCTTCG AATTATACCT CATTAATGCC ACTACTGCCT 



3310 3320 3330 3340 3350 3360 

GATGATACTC TTATGGGGGG GGGGGGGGGG TTGAGCTACT CAATGCTTAA GTGAATCGGA 



3370 3380 3390 3400 3410 3420 

GAGCACTTTG CCTTTCCAGC GGAGACTTTT TGTTGTCGGC CAGTGATGCT TGGTTGTAGA 



3430 3440 3450 3460 3470 3480 

TGGAAGTGGT GGTCATGACT CGGAGGAGGG TGTAGGGTAG CTGTACTTGC GGGTGCGTTG 



3490 3500 3510 3520 3530 3540 

TTACGAAGAG TATTTGGGCG GCGGAAGACC GGGCGGATGC CGAACCCGGA CGTGCGGTAA 



3550 3560 3570 3580 3590 3600 

CGGGGATGAG CAGCGTCAGT CGAGTCATCC ATGATTTCAG GTCCAGGGTC CAAGTCGCGT 



3610 3620 3630 3640 3650 3660 

ATTCGTATTT GTATTCCGGA TTACTGTTTG CCAGTATGGA GTTTACGGTA CTAAGGGAGA 



3670 3680 3690 3700 3710 3720 

TTATTTAGTC GAG 



BNSDOCID: <WO 9931244A1 I > 



wo 99/31244 



PCT/EP98/0797I 



53 



S EQUEN 2 PROTOKOLL 



(1) ALLGEMEINE INFORMATION: 

(i) ANMELDER: 

(A) NAME: Hoechst Marion Roussel Deutschland GmbH 

(B) STRASSE: - 

(C) ORT: Frankfurt 

(D) BUNDESIAND: - 

(E) LAND: Deutschland 

(F) POSTLEITZAHL: 65926 

(G) TELEPHON: 069-305-3005 

(H) TELEFAX: 069-35-7175 

(I) TELEX: - 

(ii) ANMELDETITEL: Regulation des Isopenicillin 

N-Synthetase-Gens (pcbC) durch das cpcRl-Genprodukt 

(iii) ANZAHL DER SEQUEN2EN: 56 

(iv) COMPUTER- LES BARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: PatentIn Release #1.0^ Version #1.25 (EPA) 



(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 13 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1,.13 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 
TTGCCGGGCC AAT 13 
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(2) INFORMATION ZU SEQ ID NO: 2: 



(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 10 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLl)SSEL: exon 

(B) LAGE: 1..10 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 
TTAGGCCTAA 10 



(2) INFORMATION ZU SEQ ID NO: 3: 



(i) SEQUENZ CHAR7UCTERISTIKA: 

(A) LANGE: 24 Basenpaare 

( B) ART : Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..24 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 
GTTGCCGGGC CAATCCCTGA GCTT 24 



(2) INFORMATION ZU SEQ ID NO: 4: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..24 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 



GTTGCCGGGC CAATCCCTGA GCTT 24 
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(2) INFORMATION 2U SEQ ID NO: 5: 

(i) SEQUEN2 CHARAKTERISTIKA: 

(A) IiANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS {genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: l.,24 



(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 5: 
AAGCTCAGGG ATTGGCCCGG CAAC 24 



(2) INFORMATION ZU SEQ ID NO: 6: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) AJ^T DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..24 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

GTTGCCGGGG gttaccctga gctt 

(2) INFORMATION ZU SEQ ID NO: 7: 

(i) SEQUENZ CHARAKTERISTIKA: 
(A) LANGE: 24 Basenpaare 
' (B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..24 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 7: 
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AAGCTCAGGG TAACCCCCGG CAAC 24 

(2) INFORMATION 2U SEQ ID NO: 8: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: PNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1. .24 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 
GTTGCCGGGC GTATCCCTGA GCTT 24 

(2) INFORMATION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) IANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 
<B) LAGE: 1..24 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 
AAGCTCAGGG ATACGCCCGG CAAC 24 

(2) INFORMATION ZU SEQ ID NO: 10: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STR?iNGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..24 
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(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 10: 
CAACCCGGGC CAATCCCTGA GCTT 24 

(2) INFORMATION 2U SEQ ID NO: 11: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..24 

(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 11: 
AAGCTCAGGG ATTGGCCCGG GTTG 24 
(2) INFORMATION ZU SEQ ID NO: 12: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 80 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NTKME/SCHLUSSEL: exon 

(B) LAGE: 1..80 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 
AATTCGTTGC CGGGCCAATC CCTGAGCTTG TTGCCGGGCC AATCCCTGAG CTTGTTGCCG 60 
GGCCAATCCC TGAGCTTCCC 80 

(2) ANGABEN ZU SEQ ID NO: 13: 

( i ) S EQUEN Z KENN Z EI CHEN : 

(A) LANGE: 76 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Genom-DNA 



(ix) MERKMAL: 
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(A) NAME/SCHLUSSEL: exon 

(B) LAGE:1..76 

(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 
GCAACGGCCC GGTTAGGGAC TCGAACAACG GCCCGGTTAG GGACTCGAAC AACGGCCCGG 60 
TTAGGGACTC GAAGGG 76 

(2) INFORMATION ZU SEQ ID NO: 14: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 80 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS {genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..80 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 
AATTCGTTGC CGGGGGTTAC CCTGAGCTTG TTGCCGGGGG TTACCCTGAG CTTGTTGCCG 60 
GGGGTTACCC TGAGCTTCCC BO 

(2) INFORMATION ZU SEQ ID NO: 15: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 76 Basenpaare 

(B) ART: NukleinsSiure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

lii) ART DES MOLEKULS: DNS Igenomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 
- (B) LAGE: 1. .76 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 
GGGAAGCTCA GGGTAACCCC CGGCAACAAG CTCAGGGTAA CCCCCGGCAA CAAGCTCAGG 60 
GTAACCCCCG GCAACG 76 

(2) INFORMATION ZU SEQ ID NO: 16: 
(i) SEQUENZ CHARAKTERISTIKA: 
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(A) LANGE: 80 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..80 

(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 16: 
AATTCGTTGC CGGGCGTATC CCTGAGCTTG TTGCCGGGCG TATCCCTGAG CTTGTTGCCG 60 
GGCGTATCCC TGAGCTTCCC 80 

(2) INFORMATION ZU SEQ ID NO: 17: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 76 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS {genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..76 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 
GGGAAGCTCA GGGATACGCC CGGCAACAAG CTCAGGGATA CGCCCGGCAA CAAGCTCAGG 60 
GATACGCCCG GCAACG 76 

(2) INFORMATION *ZU SEQ ID NO: 18: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 80 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..80 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 
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AATTCCAACC CGGGCCAATC CCTGAGCTTC AACCCGGGCC AATCCCTGAG CTTCAACCCG 60 
GGCCAATCCC TGAGCTTCCC 80 



(2) INFORMATION ZU SEQ ID NO: 19: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 76 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..76 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 
GGGAAGCTCA GGGATTGGCC CGGGTTGAAG CTCAGGGATT GGCCCGGGTT GAAGCTCAGG 
GATTGGCCCG GGTTGG 



(2) ANGABEN ZU SEQ ID NO: 20: 

(i) SEQUENZKENNZEICHEN: 

(A) IiANGE: 2546 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Genom-DNA 



(ix) MERKMAL: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE:1..2546 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 

TCCAATATGC CTGCTATGTA CGGACAAGGG TGGTCATCAT CGTTTTCCCA GCAGAACCAC 60 

GCCGGATATT CCACGCAGCC GCCGCAGCCG AGCCAGCAAG GACAGACATC GCAGATCCTC 120 

CTTCTGCAGC AAGCAAGCAA CCCCGATGCG GCATCAAATC ATTTCCCTAT GAACGGCATG 180 

AACGGCCACC CAATGGAATC CCAATTTCAT GCTCACCCGA TGCCAGCACA ACACCCGATA 240 

CAACACTCGC AGCCTCACCT ACACCAGATG CATGCTCAGC ATCAAATGCC GGCCCATGCG 300 

TTGAACCCAC ACACCTGGGC CAACGGAGAG AGCCAATCTG GAATGGATCA AACCGGTGAT 360 

GCCCTGAAGG ACAATGCGAA TGGTCTCAAA AAGGGAAAGT CTAAGAGGAG GTCGAATGCC 420 



60 
76 
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AACAATGACG GCGAGATGAA GGAGCTTTTC GAGAGCAACC GCCACAAGTC GTTGGAGGAG 480 

ATTGTTCAGG ATGTCAGGGG CAACGAGCGC GGTCCCAACG CAGAGCGCAA ACGTCAACTA 54 0 

TATGCCATGC TCTGGCTCAA CTCAGCGTGC GTGGAAAGCA AGAACTCGAT CCCACGCGGC 600 

CGGGTGTATC ACACTTATGC CTCAAAATGT ACCGACAGCA GAGTCGTAGT TCTCAACCCT 660 

GCTAGTTTCG GGAAGTTGGT GCGAGTCGTC TTCCCATCCA TCAAAACCCG ACGACTTGGA 720 

GTCCGGGGCG AGTCAAAGTA TCACTATTGC AACTTTCAAC TCCGTGATCC GCCACCGCCC 780 

GAGGTGAGCG GGCTGCGAGA CGCTAGCGTT CCCGCTCCCG AAGAGGCAGC TAAGGGGGAG 840 

GAGTTTGACT TCAACACACC GCCGAACCAG CAAAATGACG TCAAAGGAGC CAGTCGTTTA 900 

CCATCGCCGG AGGATGCTTC TCATCCACCG GTCTCCCGCG CCACATCACG GACAAGCCAT 960 

GGATTGGGTT CGCACAGCCG TTACATTGTT CCGCAGCCGC GGCGACTGAA ATCGGGATGG 1020 

GCTGGGGGCA TCTGCGCAAC GTCCAAGACG CGCATCAAGC TCCGGGTCGC AACAGAGGCG 1080 

GAAACGAAAT TCGATTGGGA CGAGCCACTG GTGTTGCCGC CGATCGACCC GTTCCTGCCG 1140 

CCGCACACAG ATAAGGACGC GGCCGCCTCG CTGGTGGCCC TGTACCGCGC GCAGTTGACA 1200 

TCCCTCGCTG AGGCCTTCCG ATACATCAGG GACAAGAGCT TTTTCCACCT GTACACGTCC 1260 

TTCCACGGCA CATTGACGAT GCCTGTACAG AAGCTCTTTG CGCATCCGAG CATTGCTCCT 1320 

TGGATCGAGG AGTGCGACCT TGTTCTGTAC CAGCGGCTGA CCAAATTCGC CTTCACCATG 1380 

TCGCTCGTGG TGGTGCCTAA TGTGTATCTC AACCGGATGC GGTCCATCGC CGACCGTCTC 1440 

GTGCCGCACA TTGTGGACGT GTTCGGCGGG CATCCTGAGC ATGTGGTGCA AGCCAAGGCG 1500 

GGTCCGGCGG CCATCTTCGT AGGCATCCTG GAGCGGATGA CGCGTGTGAA CAAGACGGCG 1560 

CACGCGGCGG CCAGACCAGT GGCGTTGGAC GCCAACAGGG ACCAGATGTA CGCGGATTGG 1620 

CTGGAACTGG TCAACGCGCG CAAGATTGCC GAGTGCGTGC CGACGCGGGG AATGGACGAT 1680 

GTGGCGGAGC TACTTGTCAG GGAGATGCGG TATCTCGTGG ACCCCAAGAA CTATATTCCG 1740 

GATGACGAGA CTTCGAATGC CGATGCTGGA GGGGCCCGGT CACCGTTTGC CGTCAACCGA 1800 

T6GCGGGACT TTCTGATGAG TCTGCCCGGC AAGTTCCCGT ATGCGTCACA CGAAGACATT 1860 

GTTTGGTGCG TGGAGAGGGT GGGGACGGCG ATTGTGAGGG AGCTCACCTT GCAAGGGGGC 1920 

ACCAGCTTCA CAACGTGGTG GTCTATCAAG ACGTTCCTCG ACGAGGAGAT TATGTACCTG 1980 

GCCGAGGTTG GCGGGCTCAT GCATACGAAG AGCCTGCGCG ATGAGCCGTC AAGGCAGCAA 2040 

GCGACAACGG TCGTGACGGA AAGAGGCCAA AAAGGGGCCA CAGCGGACGA CGACGGTGAG 2100 

GTGGTGATGG GCGACGCAGG TCAGGAGGT^iA CCGATGGCGG TGGCGGCGTC GCCGGTGCAC 2160 

ACAGACCGGG CGCCATTCCC ACCGAAACAG GGAGATGCGG CCAACATGGG CGACGCGGCA 2220 
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AGTGATGCGC 


ACGATGACAG 


TGGGATAGGG 


ATCCGGACCC 


CCGAGACGGA 


CTTTCCGGTG 


2280 


GACAAGTTTG 


GACT C CAT GA 


GGCGGAGGCG 


GGGGTCACAG 


AACTAGCCTA 


CGAAGGGTTG 


234 U 


GATCGAGAAT 


GGGCGGCTCC 


TGCATGACGA 


GGCCTGACGA 


AGGCACGAAG 


AGATGAACAG 


2400 


CACGTGTTGG 


ATTAACGGTA 


TATCCCGGGG 


TTCTGGTTAT 


GGGTCCGGAG 


TAGGTCATGT 


2460 


CACTAAGGGG 


TCTATTGGGT 


AAATGTGATG 


TTGGGTCACT 


CTTCGAATTA 


TACCTCATTA 


2520 


ATGCCACTAC 


TGCCTGATGA 


TAAAAA 








2546 



(2) ANGABEN ZU SEQ ID NO: 21: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 830 Aminosauren 

(B) ART: Aminosaure 

(C) STRAN6F0RM: Einzelstrang 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Peptid 



(ix) MERKMAL: 

(A) NAME/SCHLOSSEL: Peptide 

(B) LAGE:1..830 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

Met Arg Ala Asp Glu Pro Ala Ala Ala lie Gin Ala Ser Ser Ala Ala 
15 10 15 

Met Arg Pro Gin Ser Arg Ala Ser Thr Ser Ser Thr His Ser Ala Ala 

20 25 30 

Thr Gin Pro Thr Thr Asp Ala His Asp Tyr Ser Asn Met Pro Ala Met 
35 40 45 

Tyr Gly Gin Gly Trp Ser Ser Ser Phe Ser Gin Gin Asn His Ala Gly 
50 55 60 

Tyr Ser Thr Gin Pro Pro Gin Pro Ser Gin Gin Gly Gin Thr Ser Gin 
65 70 75 80 

lie Leu Leu Leu Gin Gin Ala Ser Asn Pro Asp Ala Ala Ser Asn His 

85 90 95 

Phe Pro Met Asn Gly Met Asn Gly His Pro Met Glu Ser Gin Phe His 

100 105 110 

Ala His Pro Met Pro Ala Gin His Pro He Gin His Ser Gin Pro His 
115 120 125 

Leu His Gin Met His Ala Gin His Gin Met Pro Ala His Ala Leu Asn 
130 135 140 

Pro His Thr Trp Ala Asn Gly Glu Ser Gin Ser Gly MBt Asp Gin Thr 
145 150 155 160 
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Gly Asp Ala Leu Lys Asp Asn Ala Asn Gly Leu Lys Lys Gly Lys Ser 

165 170 175 

Lys Arg Arg Ser Asn Ala Asn Asn Asp Gly Glu Met Lys Glu Leu Phe 

180 185 190 

Glu Ser Asn Arg His Lys Ser Leu Glu Glu lie Val Gin Asp Val Arg 
195 200 205 

Gly Asn Glu Arg Gly Pro Asn Ala Glu Arg Lys Arg Gin Leu Tyr Ala 
210 215 220 

Met Leu Trp Leu Asn Ser Ala Cys Val Glu Ser Lys Asn Ser lie Pro 
225 230 235 240 

Arg Gly Arg Val Tyr His Thr Tyr Ala Ser Lys Cys Thr Asp Asp Arg 

245 250 255 

Val Val Val Leu Asn Pro Ala Ser Phe Gly Lys Leu Val Arg Val Val 

260 265 270 

Phe Pro Ser lie Lys Thr Arg Arg Leu Gly Val Arg Gly Glu Ser Lys 
275 280 285 

Tyr His Tyr Cys Asn Phe Gin Leu Arg Asp Pro Pro Pro Pro Glu Val 
290 295 300 

Ser Gly Leu Arg Asp Ala Ser Val Pro Ala Pro Glu Glu Ala Ala Lys 
305 310 315 320 

Gly Glu Glu Phe Asp Phe Asn Thr Pro Pro Asn Gin Gin Asn Asp Val 

325 330 335 

Lys Gly Ala Ser Arg Leu Pro Ser Pro Glu Asp Ala Ser His Pro Pro 

340 345 350 

Val Ser Arg Ala Thr Ser Arg Thr Ser His Gly Leu Gly Ser His Ser 
355 360 365 

Arg Tyr lie Val Pro Gin Pro Arg Arg Leu Lys Ser Gly Trp Ala Gly 
370 375 380 

Gly lie Cys Ala Thr Ser Lys Thr Arg lie Lys Leu Arg Val Ala Thr 
385 390 395 400 

Glu Ala Glu Thr Lys Phe Asp Trp Asp Glu Pro Leu Val Leu Pro Pro 

405 410 415 

lie Asp Pro Phe Leu Pro Pro His Thr Asp Lys Asp Ala Ala Ala Ser 

420 425 430 

Leu Val Ala Leu Tyr Arg Ala Gin Leu Thr Ser Leu Ala Glu Ala Phe 
435 440 445 

Arg Tyr lie Arg Asp Lys Ser Phe Phe His Leu Tyr Thr Ser Phe His 
450 455 460 



Gly Thr Leu Thr Met Pro Val Gin Lys Leu Phe Ala His Pro Ser lie 
465 470 475 480 
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Ala Pro Trp lie Glu Glu Cys Asp Leu Val Leu Tyr Gin Arg Leu Thr 

485 490 495 

Lys Phe Ala Phe Thr Met Ser Leu Val Val Val Pro Asn Val Tyr Leu 

500 505 510 

Asn Arg Met Arg Ser lie Ala Asp Arg Leu Val Pro His lie Val Asp 
515 520 525 

Val Phe Gly Gly His Pro Glu His Val Val Gin Ala Lys Ala Gly Pro 
530 535 540 

Ala Ala lie Phe Val Gly lie Leu Glu Arg Met Thr Arg Val Asn Lys 
545 550 555 560 

Thr Ala His Ala Ala Ala Arg Pro Val Ala Leu Asp Ala Asn Arg Asp 

565 570 575 

Gin Met Tyr Ala Asp Trp Leu Glu Leu Val Asn Ala Arg Lys lie Ala 

580 585 590 

Glu Cys Val Pro Thr Arg Gly Met Asp Asp Val Ala Glu Leu Leu Val 
595 600 605 

Arg Glu Met Arg Tyr Leu Val Asp Pro Lys Asn Tyr lie Pro Asp Asp 
610 615 620 

Glu Thr Ser Asn Ala Asp Ala Gly Gly Ala Arg Ser Pro Phe Ala Val 
625 630 635 640 

Asn Arg Trp Arg Asp Phe Leu Met Ser Leu Pro Gly Lys Phe Pro Tyr 

645 650 655 

Ala Ser His Glu Asp lie Val Trp Cys Val Glu Arg Val Gly Thr Ala 

660 665 670 

He Val Arg Glu Leu Thr Leu Gin Gly Gly Thr Ser Phe Thr Thr Trp 
675 680 685 

Trp Ser He Lys Thr Phe Leu Asp Glu Glu He Met Tyr Leu Ala Glu 
690 695 700 

Val Gly Gly Leu Met His Thr Lys Ser Leu Arg Asp Glu Pro Ser Arg 
705 710 715 720 

Gin Gin Ala Thr Thr Val Val Thr Glu Arg Gly Gin Lys Gly Ala Thr 

725 730 735 

Ala Asp Asp Asp Gly Glu Val Val Met Gly Asp Ala Gly Gin Glu Glu 

740 745 750 

Pro Met Ala Val Ala Ala Ser Pro Val His Thr Asp Arg Ala Pro Phe 
755 760 765 

Pro Pro Lys Gin Gly His Ala Ala Asn Met Gly Asp Ala Ala Ser Asp 
770 - 775 . 780 

Ala His Asp Asp Ser Gly He Gly He Arg Thr Pro Glu Thr Asp Phe 
785 790 795 800 
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Pro Val Asp Lys Phe Gly Leu His Glu Ala Glu Ala Gly Val Thr Glu 

805 810 815 

Leu Ala Tyr Glu Gly Leu Asp Arg Glu Trp Ala Ala Pro Ala 

820 825 830 



(2) INFORMATION ZU SEQ ID NO: 22: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 75 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Peptid 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: Peptide 

(B) LAGE: 1..75 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 

Ala Met Leu Trp Leu Asn Ser Ala Cys Val Glu Ser Lys Asn Ser lie 

15 10 15 

Pro Pro Gly Arg Val Tyr His Thr Tyr Ala Ser Lys Cys Thr Asp Ser 

20 25 30 

Arg Val Val Val Leu Asn Pro Ala Ser Phe Gly Lys Leu Val Arg Val 
35 40 45 

Val Phe Pro Ser He Lys Thr Arg Arg Leu Gly Val Arg Gly Glu Ser 
50 55 60 



Lys Tyr His Tyr Cys Asn Phe Gin Leu Arg Asp 
65 70 75 



(2) INFORMATION ZU SEQ ID NO: 23: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 76 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Peptid 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: Peptide 

(B) LAGE: 1..76 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 
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Gly Glu Cys Trp Leu Lys Arg Ala Cys Glu Glu Gin Gin Asp Ala Ala 
15 10 15 

Val Gin Arg Asn Gin lie Tyr Ala His Tyr Val Glu lie Cys Asn Ser 

20 25 30 

Leu His lie Lys Pro Leu Asn Ser Ala Ser Phe Gly Lys Leu Val Arg 
35 40 45 

Leu Leu Phe Pro Ser lie Lys Thr Arg Arg Leu Gly Met Arg Gly His 
50 55 60 

Ser Lys Tyr His Tyr Cys Gly lie Lys Leu Arg Gly 
65 70 75 



(2) INFORMATION 2U SEQ ID NO: 24: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LAnGE: 76 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Peptid 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: Peptide 

(B) LAGE: 1,.76 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

Ala Leu Leu Trp Leu Met Lys Asn Cys Lys Trp Gin His Asp Ser Tyr 
15 10 15 

Val Pro Arg Gly Lys lie Phe Ala Gin Tyr Ala Ser Ser Cys Ser Gin 

20 25 30 

Asn Asn Leu Lys Pro Leu Ser Gin Ala Ser Leu Gly Lys Leu lie Arg 
35 40 45 

Thr Val Phe Pro Asp Leu Thr Thr Arg Arg Leu Gly Met Arg Gly Gin 
50 55 60 

Ser Lys Tyr His Tyr Cys Gly Leu Lys Leu Thr Val 
65 70 75 



(2) INFORMATION ZU SEQ ID NO: 25: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 76 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) 7VRT DES MOLEKOLS: Peptid 
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(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: Peptide 

(B) LAGE: 1..76 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 

Thr Val Gin Trp Leu Leu Asp Asn Tyr Glu Thr Ala Glu Gly Val Ser 
15 10 15 

Leu Pro Arg Ser Thr Leu Tyr Cys His Tyr Leu Leu His Cys Gin Glu 

20 25 30 

Gin Lys Leu Glu Pro Val Asn Ala Ala Ser Phe Gly Lys Leu lie Arg 
35 40 45 

Ser Val Phe Met Gly Leu Arg Thr Arg Arg Leu Gly Thr Arg Gly Asn 

50 55 60 

Ser Lys Tyr His Tyr Tyr Gly Leu Arg lie Lys Ala 
65 70 75 



(2) INFORMATION 2U SEQ ID NO; 26: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 158 Andnosauren 

(B) ART: AminosSure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Peptid 



(ix) MERKMALE: 

(A) NAME/SCHLl)SSEL: Peptide 

(B) LAGE: 1..158 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

lie Phe Val Gly lie Leu Glu Arg Met Thr Arg Val Asn Lys Thr Ala 
15 10 15 

His Ala Ala Ala Arg Pro Val Ala Leu Asp Ala Asn Arg Asp Gin Met 

20 25 30 

Tyr Ala Asp Trp Leu Glu Leu Val Asn Ala Arg Lys lie Ala Glu Cys 
35 40 45 

Val Pro Thr Arg Gly Met Asp Asp Val Ala Glu Leu Leu Val Arg Glu 
50 55 60 

Met Arg Tyr Leu Val Asp Pro Lys Asn Tyr lie Pro Asp Asp Glu Thr 
65 70 75 80 

Ser Asn Ala Asp Ala Gly Gly Ala Arg Ser Pro Phe Ala Val Asn Arg 

85 90 95 

Trp Arg Asp Phe Leu Met Ser Leu Pro Gly Lys Phe Pro Tyr Ala Ser 
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His Glu Asp He Val Trp Cys Val 
115 120 

Arg Glu Leu Thr Leu Gin Gly Gly 
130 135 

He Lys Thr Phe Leu Asp Glu Glu 
145 150 



105 110 

Glu Arg Val Gly Thr Ala He Val 

125 

Thr Ser Phe Thr Thr Trp Trp Ser 

140 

He Met Tyr Leu Ala Glu 
155 



(2) INFORMATION ZU SEQ ID NO: 27: 

(i) SEQUEN2 CHARAKTERISTIKA: 

(A) LANGE: 168 Aminosauren 

(B) ART: AminosSure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: Peptid 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: Peptide 

(B) LAGE: 1..168 



(xi) S EQUENZ EES CHREI BUNG: SEQ ID NO: 27: 

He Phe Ser Asn Leu Leu Ser Arg Leu Leu Arg Val Asn Asp Thr Ala 
15 10 15 

His Ala Ala Ala Arg Phe Leu Ala Asn Pro Ala Asp Arg His Leu He 

20 25 30 

Cys Asn Asp Trp Glu Arg Phe Val Ser Thr Arg Phe He Val His Arg 
35 40 45 

Glu Leu Met Cys Asn Asp Lys Glu Ala Val Ala Ala Leu Asp Glu Trp 
50 55 60 

Tyr Ser He Leu Ser Thr Cys Ser Asn Pro Ser Asp Leu Leu Asp Pro 
65 70 75 80 

Leu Lys Asp Lys His Glu Ala Ser Asp Thr Ser Met Lys Arg Val Glu 

85 90 95 

Leu Arg Gin He Asp Gly Val Leu Asp Arg Met Ala Asp Phe Phe Leu 

100 105 110 

Glu Leu Pro Ser Arg Phe Pro Ser Cys Ser Pro Arg Met Phe Leu Leu 
115 120 125 

Cys Leu Gly Ala Leu Gin Thr Ser Val Leu Arg Glu He Thr Val Ser 
130 135 140 

• Gly Gly Glu Ala Phe Gly Ala Leu Trp Val He Arg Cys Trp Val Asp 
145 150 155 160 
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Glu Tyr Met Thr Trp Val Ala Glu 

165 



(2) INFOPWlTION ZU SEQ id NO: 28; 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 159 Aininosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : Peptid 



(ix) MERKMALE: 

(A) NAME/SCHLl)SSEL: Peptide 

(B) LAGE: 1..159 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 

Asn Phe Thr Lys Leu Val Lys Lys Leu lie Lys Leu Leu Lys Phe lie 
15 10 15 

Leu Asn Phe Leu Lys Ser Phe Pro lie Phe Lys Ser Gly Met Asn Asn 

20 25 30 

Asp Trp Lys Asn lie Val Asn Leu Asp Asp lie Leu Glu Met Met lie 
35 40 45 

Asn Glu Asp Asp Thr Asn Ser Glu Thr Asn Thr lie Met Gin His Leu 
50 55 60 

Gin Gly Phe Cys Gin Val Phe Val Thr Lys Phe Leu Asn Ser Ser Met 
65 70 75 80 

Ser Val Ser Asn Asp Pro Ser Val Ser lie Glu Cys Lys Ser Leu Asn 

85 90 95 

Glu Met lie Lys Asp Phe Cys Ser Phe lie Ser Leu Gin Ser Lys Phe 

100 105 110 

Ser Cys Leu Lys Leu He Asp Cys Ser Thr Arg Phe Arg Asn Ala He 
115 120 125 

He Gly Asp He Ser Leu Lys Ser Asn Glu Asn Leu Leu Ser Trp Leu 
• 130 135 140 

Phe Leu Asn Asn Val Met Gly Gin Leu Leu Asn Tyr Cys Phe Glu 
145 150 155 



(2) INFORMATION ZU SEQ ID NO: 29: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) IANGE:. 149 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS : Peptid 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: Peptide 

(B) LAGE: 1..149 

(xi) SEQUENZBESCHREXBUNG: SEQ ID NO: 29: 

Ala Phe Ala Gin Thr Leu Arg Arg Tyr Thr Ser Leu Asn His Leu Ala 
15 10 15 

Gin Ala Ala Arg Ala Val Leu Gin Asn Thr Ala Gin lie Asn Gin Met 

20 25 30 

Leu Ser Asp Leu Asn Arg Val Asp Phe Ala Asn Val Gin Glu Gin Ala 
35 40 45 

Ser Trp Val Cys Arg Cys Glu Asp Arg Val Val Gin Arg Leu Glu Gin 
50 55 • 60 

Asp Phe Lys Val Thr Leu Gin Gin Gin Asn Ser Leu Glu Gin Trp Ala 
65 70 75 80 

Ala Trp Leu Asp Gly Val Val Ser Gin Val Leu Lys Pro Tyr Gin Gly 

85 90 95 

Ser Ala Gly Phe Pro Lys Ala Ala Lys Leu Phe Leu Leu Lys Trp Ser 

100 105 110 

Phe Tyr Ser Ser Met Val lie Arg Asp Leu Thr Leu Arg Ser Ala Ala 
115 120 125 

Ser Phe Gly Ser Phe His Leu lie Arg Leu Leu Tyr Asp Glu Tyr Met 
130 135 140 

Tyr Tyr Leu lie Glu 
145 



(2) INFORMATION ZU SEQ ID NO: 30: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: Nukleinsdure. 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..22 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: 



CATGAAGCTT TCGCGAGAAT TC 22 
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(2) INFORMATION ZU SEQ ID NO: 31: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) IAngE: 18 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..18 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: 
GAATTCTCGC GAAAGCTT 18 



(2) INFORMATION ZU SEQ ID NO: 32: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 23 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..23 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 
CATGCAAGCT TTCGCGAGAA TTC 23 



(2) INFORMATION ZU SEQ ID NO: 33: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 19 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..19 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 
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GAATTCTCGC GAAAGCTTG 19 

(2) INFORMATION ZU SEQ ID NO: 34: 

(i) SEQUEN2 CHARAKTERISTIKA: 

(A) LANGE: 24 Basenpaare 

(B) ART: Nukleins^ure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1. .24 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 
CATGCTAAGC TTTCGCGAGA ATTC 24 

(2) INFORMATION ZU SEQ ID NO: 35: 

(i) SEQUEN2 CHARAKTERISTIKA: 

(A) LAnGE: 20 Basenpaare 

(B) ART: Nukleinsdure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..20 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 35: 
GAATTCTCGC GAAAGCTTAG 20 

(2) INFORMATION ZU SEQ ID NO: 36: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 4 4 Basenpaare 

(B) ART: NuJcleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..44 
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(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 36: 
AAACCGTCAC CATGAAGCTT TCGCGAGAAT TCGGGTCGAT CAGG 



(2) INFORMATION 2U SEQ ID NO: 37: 

|i) SEQUENZ CHARAKTERISTIKA: 

(A) IANGE: 44 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix). MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..44 



(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 37: 
CCTGATCGAC CCGAATTCTC GCGAAAGCTT CATGGTGACG GTTT 



(2) INFORMATION 2U SEQ ID NO: 38: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 45 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 



(ix) MERKMALE: 

(A) N/^E/SCHLUSSEL: exon 

(B) LAGE: 1««45 



(Xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 38: 
AAACCGTCAC CATGCAAGCT TTCGCGAGAA TTCGGGTCGA TCAGG 



(2) INFORMATION ZU SEQ ID NO: 39: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 45 Basenpaare 

(B) ART: Nukleins&ure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 
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(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..45 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 39: 
CCTGATCGAC CCGAATTCTC GCGAAAGCTT GCATGGTGAC GGTTT 45 



(2) INFORMATION ZU SEQ ID NO: 40: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 46 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

{ii) .ART DES MOLEKOLS : DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..46 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 40: 
AAACCGTCAC CATGCTAAGC TTTCGCGAGA ATTCGGGTCG ATCAGG 46 



(2) INFORMATION 2U SEQ ID NO: 41: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 4 6 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..46 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 41: 
CCTGATCGAC CCGAATTCTC GCGAAAGCTT AGCATGGTGA CGGTTT 46 



(2) INFORMATION ZU SEQ ID NO: 42: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) IANGE: 86 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 
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(ii) ART DBS MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..86 



(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 42: 
AAACCGTCAC CATGCGTCTG TCCATCATCG CAGTCCTTCC CCTGGCCCTC GCCATGAAGC 60 
TTTCGCGAGA ATTCGGGTCG ATCAGG ftfi 



(2) INFORMATION ZU SEQ ID NO: 43: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 86 Basenpaare 

(B) ART: NukleinsSure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..86 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 
CCTGATCGAC CCGAATTCTC GCGAAAGCTT CATGGCGAGG GCCAGGGGAA GGACTGCGAT 60 
GATGGACAGA CGCATGGTGA CGGTTT 86 



(2) INFORMATION ZU SEQ ID NO: 44: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 87 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1,,87 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 
AAACCGTCAC CATGCGTCTG TCCATCATCG CAGTCCTTCC CCTGGCCCTC GCCATGCAAG 60 
CTTTCGCGAG AATTCGGGTC GATCAGG ft 7 



(2) INFORMATION ZU SEQ ID NO: 45: 
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(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 87 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..87 



(xi) SEQUENZBESCHREIBUNG; SEQ ID NO: 45: 
CCTGATCGAC CCGAATTCTC GCGAAAGCTT GCATGGCGAG GGCCAGGGGA AGGACTGCGA 60 
TGATGGACAG ACGCATGGTG ACGGTTT 87 



(2) INFORMATION 2U SEQ ID NO: 46: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 88 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 
(B) LAGE: 1..8e 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 46: 
AAACCGTCAC CATGCGTCTG TCCATCATCG CAGTCCTTCC CCTGGCCCTC GCCATGCTAA 
GCTTTCGCGA GAATTCGGGT CGATCAGG 



(2) INFORMATION ZU SEQ ID NO: 47: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 88 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..88 



60 
88 
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(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 47: 
CCTGATCGAC CCGAATTCTC GCGAAACGTT AGCATGGCGA GGGCCAGGGG AAGGACTGCG 60 
ATGATGGACA GACGCATGGT GACGGTTT 88 



(2) INFORMATION ZU SEQ ID NO: 48: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 104 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANG FORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1,.104 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 48: 
AAACCGTCAC CATGGTCACC CTCCGCCGCC TCGCCGTCCT CCTCGGCGCC ATCCCCGCCG 60 
CCCTCGCCGC CATGAAGCTT TCGCGAGAAT TCGGGTCGAT CAGG 104 



(2) INFORMATION ZU SEQ ID NO: 49: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 104 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..104 



(xi). SEQUENZBESCHREIBUNG: SEQ ID NO: 49: 
CCTGATCGAC CCGAATTCTC GCGAAAGCTT CATGGCGGCG AGGGCGGCGG GGATGGCGCC 60 
GAGGAGGACG GCGAGGCGGC GGAGGGTGAC CATGGTGACG GTTT 104 



(2) INFORMATION ZU SEQ ID NO: 50: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 105 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 
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(D) TOPOLOGIE: linear 
lii) ART DES MOLEKULS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1,.105 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 50: 
AAACCGTCAC CATGGTCACC CTCCGCCGCC TCGCCGTCCT CCTCGGCGCC ATCCCCGCCG 60 
CCCTCGCCGC CATGCAAGCT TTCGCGAGAA TTCGGGTCGA TCAGG 105 

(2) INFORMATION ZU SEQ ID NO: 51: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 105 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..105 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 51: 
CCTGATCGAC CCGAATTCTC GCGAAAGCTT GCATGGCGGC GAGGGCGGCG GGGATGGCGC 60 
CGAGGAGGAC GGCGAGGCGG CGGAGGGTGA CCATGGTGAC GGTTT 105 

(2) INFORMATION ZU SEQ ID NO: 52: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 106 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..106 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 52: 
AAACCGTCAC CATGGTCACC CTCCGCCGCC TCGCCGTCCT CCTCGGCGCC ATCCCCGCCG 60 
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CCCTCGCCGC CATGCTAAGC TTTCGCGAGA ATTCGGGTCG ATCAGG 106 



(2) INFOjRMATION ZU SEQ ID NO: 53: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 106 Basenpaare 

(B) ART: NukleinsSure 

(C) STRANGFORM: Doppel 
. (D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: exon 

(B) LAGE: 1..106 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 53: 
CCTGATCGAC CCGAAATCTC GCGAAACGTT AGCATGGCGG CGAGGGCGGC GGGGATGGCG 60 
CCGAGGAGGA CGGCGAGGCG GCGGAGGGTG ACCATGGTGA CGGTTT 106 



(2) INFORMATION ZU SEQ ID NO: 54 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) XiANGE: 21 Basenpaare 

(B) ART: NukleinsSiure 

(C) STRANGFORM: Einzel 
<D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..21 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 54: 
CCTGCTATGT ACGGACAAGG G 



(2) INFORMATION ZU SEQ ID NO: 55: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 22 Basenpaare 

(B) ART: NukleinsSure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: DNS (genomisch) 



(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 
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(B) LAGE: 1. .22 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 55: 
CCTCGTCATG CAGGAGCCGC CC 22 



(2) INFORMATION ZU SEQ ID NO: 56: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 16 Basenpaare 

(B) ART: Nukleotide 
|C) STRANGFORM: Einzel 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : DNS (genomisch) 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: exon 

(B) LAGE: 1..16 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 56: 
NNGTNRCCRG YAACNN 16 
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Patentanspruche: 

1. DNA-bindendes Protein, welches als Monomer, Homodimer oder Teil eines 
Heterodimer an doppelstrSngige DNA der Sequenz GTTGCCGGGCCAAT 
CCCTGAGCTT (SEQ ID NO.: 4) aus dem intergenischen Bereich des pcbAB und 
pcbC-Gens von Acremonium chrysogenum bindet und in der Lage ist, die 
Transkription des pcbAB und/oder pcbC-Gens zu beinflussen. 

2. DNA-bindendes Protein gemali Anspruch 1, dadurch gekennzeichnet, dali es 
die Aminosauresequenz des CPCR1 -Proteins gemaft Tab. 7 (SEQ ID NO.: 21) oder 
Teile davon enthSlt. 

3. Fusionsprotein. enthaltend die Aminosauresequenz des CPCR1 -Proteins 
gemali Tab. 7 (SEQ ID NO.: 21) Oder Teile davon und eine Transaktivierungs- 
domane, welches in der Lage ist, die Transkription des pcbAB und/oder pcbC-Gens 
zu beeinflussen. 

4. Fusionsprotein gemSB Anspruch 3, dadurch gekennzeichnet. daB die 
genannten Teile des CPCR1 Proteins der DNA-Bindungsdomane (Aminosauren 180 
bis 254 gemSft Tab. 7) und/oder der Dimerisierungsdomane (Aminosauren 502 bis 
660 gemali Tabelle 7) entsprechen und die Transaktivierungsdomane vom 
Transkriptionsfaktor GAL4 (Aminosauren 768 bis 881 ) stammt. 

5. DNA-Molekul. kodierend fur ein Protein gem§R einem oder mehreren der 
Anspruche 1 bis 4. 

6. DNA-Molekul gemalX Anspruch 5. dadurch gekennzeichnet, dali 

(a) es eine DNA-Sequenz gemali Tabelle 6 (SEQ ID NO.: 20) oder Teile davon 
enthalt; 
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(b) es eine DNA-Sequenz gemali Tabelle 13 (SEQ ID NO.: 57) Oder Teile davon 
enthalt; 

(c) es eine DNA-Sequenz enthalt. die in der Lage ist, mit den DNA-Molekulen 
gemaB (a) oder (b) unter stringenten Bedingungen zu hybridisieren, oder 
Teile davon; 

(d) es eine DNA-Sequenz enthalt, die aufgrund der Degeneriertheit des 
genetischen Codes von den DNA-Molekulen gem^fi (a), (b) und (c) 
verschieden ist, jedoch die Expression der entsprechend mit den DNA- 
Molekulen gemaB (a), (b) und (c) exprimierbaren Proteinen ermoglicht. oder 
Teile davon. 

7. Vektor. enthaltend eine DNA gemali Anspruch 5 oder 6. 

8. Vektor gemaB Anspruch 7, dadurch gekennzeichnet, daB es ein Vektor 
geeignet zur Expression in Acremonium chrysogenum oder Saccharomyces 
cerevisiae ist. 

9. Vektor gemSB Anspruch 7. dadurch gekennzeichnet. daB er ausgev^^ahlt wird 
aus der Gruppe enthaltend die Vektoren pGC1 und pGCIADIMI. 

10. Wirtszelle, enthaltend eine oder mehrere Kopien eines Vektors gemaB einem 
Oder mehreren der Anspruche 7 bis 9 oder eine DNA gemaB einem der Anspruche 5 
Oder 6. 

1 1 . Wirtszelle gemaB Anspruch 10. dadurch gekennzeichnet, daB sie ausgewahit 
ist aus der Gruppe enthaltend Acremonium chrysogenum und Saccharomyces 
cerevisiae. 
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12. Verfahren zur Herstellung eines DNA-bindenden Proteins gemaG einem oder 
mehreren der AnsprCiche 1 bis 4. dadurch gekennzeichnet, dafi eine DNA gemaB 
einem der Anspruche 5 oder 6 mittels eines Vektors gemafi einem der Anspruche 7 
bis 9 in einer Wirtszelle gemaU Anspruch 10 oder 1 1 exprimiert und isoliert wird. 

13. Verfahren zur Steigerung der Cephalosporin C-Ausbeute in Acremonium 
chrysogenum, bei dem die Expression des cpcRI-Genprodukts mit gentechnischen 
Mittein variiert wird und das Cephalosporin C isoliert wird. 

14. Verfahren gemali Anspruch 13. dadurch gekennzeichnet, dafi die variierte 
Expression durch Einbringen einer oder mehrerer Kopien des cpcRI-Gens in den 
Wirtsorganismus zusatzlich zum endogenen cpcRI-Gen erreicht wird. 

15. Verfahren gemali Anspruch 13, dadurch gekennzeichnet. dali die variierte 
Expression durch Integration einer oder mehrerer zusatzlicher DNA- 
Bindesequenzen TTGCCGGGCCAAT (SEQ ID NO.: 1) des DNA-bindenden 
Proteins gemaB einem der Anspruche 1 bis 4 im pcbAB/pcbC-Promotor erreicht 
wird. 

16. DNA-Bindungsstelle fur ein DNA-bindendes Protein gemali einem oder 
mehreren der Anspruche 1 bis 4, ausgewahit aus der Gruppe enthaltend die 
doppelstrangigen Sequenzen GTTGCCGGGCCAATCCCTGAGCTT (SEQ ID NO.: 
4), TTGCCGGGCCAAT (SEQ ID NO.: 1) und GTTGCCGGGCGTATCCCTGAGCTT 
(SEQ ID NO.: 8). 

17. Vektor gemali einem oder mehreren der Anspruche 7 bis 9, enthaltend eine 
Oder mehrere Kopien der DNA-Sequenzen gemali Anspruch 16. 
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BUDAPESTEr. VER7RAG CLZ^ DIE r.>rrERNATIONA 
/mVERKENNUNG Dtk hlNTERLFGUN'"! VOM M3KR00R jAi .^NIEN 
FUR DIE.Z^VXGKE VCN PA rE.iTVcRFAHREN 



fNTERNATIONALES FORMBLATT 



Hoechst Marion Roussel 



65926 Frankfurt 


LEBENSFAHJGK£!TSBESCHEIN1GUNC 

ausgcstclli gcmafl Rcgel \02 von dcr unien angcgcbcnen 

fNTERNATlONALFN HTNTFRI FrJirNn^^TFl I P 


I. KINTERJLEGai 


II. KENNZEICHNUNG DES MIKROORGANISMUS 


Name: Hoechst Marion Roussel 
Anschrift: 65 926 Frankfurt 


Von der INTERNATIONALEN HTNTERLEGUNGSSTELLE 
zugcieilte EINGANGSNUMMER: 

DSM 11878 

Datum der Hinterlegung oder Weiicrleining*: 
1997-11-28 


III. LEBENSFAHIGKErrSBESCHEINlGUNG 


Die Lebcnst^igkcit des unter 11 genanmen Mikroorganismus isi am 1997 
Zu diesem Zcitpunki war der Mikroorganismus 


-11-28 ^ geprtllt worden. 


(Xy lebensfimig 

( )' ntcht mehr iebensfllhig 




IV. BEDINGUNGEN. insTTER DENEN DIE LEBENSFAHIGKEiTSPRUFUNG DURCHGEFOHRT WORDEN 1ST 




V. INTERNATIONALE WNTERLEGUNGSSTELLE 


Name: DSNrlZ -DEUTSCHE SAMMLUNC VON 

NOKROORGANISNIEN UND ZELLKULTUREN GmbH 


UntcrschrifKcn) dcr zur Vcnrctung dcr inicmaiionaJcn Hintcrlcgungsstcllc 
befugten Pcrson(en) oder des (dcr) von ihr crmachiigten Bcdiensteien: 


Anschrift: Mascheroder Weg lb 
D-38I24 Braunschweig 


Dawm: 1997-12-02 



Angabe des Dacums dcr Ersihinterlegung. Wenn eine cmeute Hinterlegung oder cine Weiierleicung vorgenommen worden isL Angabe des Daiums 
der jeweils leaien enseuien Hinterlegung oder Weiter ietning. 

In den in Regel lOJ Buchstabe a Zifler ii und iii vorgesehcnen Fallen' .Angabe der leaten tebenstlihigkeitspmtung. 
ZutrelTendes ankrcuzen. 

.AusfilHen. wenn die .Angaben beaniragi worden smd und wenn die Ergebnisse der Prtitung negativ waitn. 
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BUDAPESTERNCRTltAG UPER TIE H^iTRNATIONrfi 
«NERK£NNUNG DER tJCNrERLECUNC VO:i VOKROORG \NioMEN 
FUR DIE jWECfJE VON PAlcMVEKFArfREN • 



IKTERNATIONALES FORMBLATT 



Hoechst Marion Roussel 



€5926 Frankfurt 


LEBENSFAHlGKEnSBESCHEINlGUNG 

ausgestellt gemlfl Regel 10.2 von der untcn angegebcnen 

INTERNATIONALEN HINTERLEGUNGSSTELLE 


I. HINTERLEGER 


n. KENNZEICHNUNG DES MIKROORGANISMUS 


Name: Hoechst Marion Roussel 
Anschrift: 65926 Frankfurt 


Von der I>nTRNAT10NALEN HINTERLEGUNGSSTELLE 
zugeteilte EINGANGSNUMMER: 

DSM 11878 

Datum der Hinteriegung Oder Weiterleicung': 

1997-11-28 


III. LEBENSFAHIGKEITSBESCHEINIGUNO 


Die Lebcnsf^igkeit des untcr U gcnanntcn Mikroorganismus ist am 1997- 
Zu diescm Zeitpunla war der Mikroorganismus 


-11-28' geprtlft worden. 


(X}' lebensnUiig 

( f nicht mehr kbensfhhig 




IV. BEDINGUNGEN, UNTER DENEN DIE IEBENSFAHIGKEITSPROFUNG DURCHGEFOHRT WORDEN IST 




V. IhnrERNATlONALE HINTERLEGUNGSSTELLE 


Name: DSMZ-DEUTSCHE SAMMLUNG VON 

M1KR00RGAN1S\IEN UND ZELLKULTUREN GmbH 


UnterschrifUen) der zur Venrening der intemationaien Htnicrlegungsstelle 
befiigien Person(en) oder des (der) von thr ermachtigten Bediensteicn: 


Anschrift: Maschcroder Weg lb 
D*38124 Braunschweig 


Damm: 1997-12-02 



Angabe des Damms der Ersthintcrtegung. Wenn cine emeuie Hinteriegung Oder eine Weiierleining vorgcnommen worden isc Angabe des Danims 
der jeweils ieaten emeuten Hinteriegung Oder Weiterletiung. 

In den in Regel 10^ Buchstabe a ZifTer ii und iii vorgesehcnen Flllen Angabe der ieaten Lebenstllhigkeispnifung. 
ZutreiTendcs ankreuzen. 

AusfUIlen. wcnn die Angaben beantragt worden sind und wcnn die Ergebnisse der PrUfung negauv waren. 
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BUDAPESTTR VERTTUG USER DIE INTERNATIONA 
rtNERKENNUNG DER HINTERLEGUNG VON MIKROORGANiiMEN 
FUR DIE 2WECKE VON PA7ENTVERFAHREN 



INTERNATIONALES FORMBLATT 



Hoechst Marion Roussel 
65926 Frankfurt 



LEBENSFAHIGKEirSBESCHEINlCUNG 

ausgcstclli gcmafl Rcgel 10^ von dcT untcn angegebcnen 

INTERNATIONALEN HTNTERLEGUNGSSTELLE 



I. HINTERUGER 


11. KENNZEICHNUNG DES MIKROORGANISMUS 


Name: Hoechst Marion Roussel 
Anschrift: 65926 Frankfurt 


Von der INTERNATIONALEN HINTERLEGUNGSSTELLE 
zugeteilie EINGANGSNUMMER: 

DSM 11878 

Danim der Hinicrlegung odcr Wciicrlcirung': 

1997-11-28 


in. LEBENSFAHIGKEITSBESCHEINIGUNG 


Die LebeasfUiigkeU dcs unter 11 genanmen Mikroorganismus istam 1997-11-28* gepitsit wordcn. 
1 Zu d'wsem Zeitpunln war der Mikroorganismus 

(X)' tebensf^ig 

( y nicht mchr lebensfhhig 


IV. BEDINGUNGEN. UNTER DENEN DIE LEBENSFAHIGKEirSPROFUNG DURCHGEFUHRT WORDEN IST 




V. INTERNATIONALE MNTERLEGUNGSSTELLE 


Name: DSMZ-DEUTSCHE SAMMLUNG VON 

MIKROORGANISMEN UND ZELLKULTUREN GmbH 

1 Anschhft: Mascheroder Weg lb 
1 0*38124 Braunschweig 


UntcrschriWen) der zur Vcrrrctung der intcmationalen Hinicrlcgungssielle 
befugicn Pcrson(cn) oder dcs (der) von ihr cnnachtigien Bediensicien: 

Danim: 1997-12-02 



Angabc des Damms der Ersthinicrlegung. Wcnn cine crncuie Hinterlegung Oder cine Weiicrlcining vorgenommcn wordcn ist. Angabe dcs Datums 
der jeweiis Ictztcn emeuien Hinterlegung Oder Wciterieining. 

In den in Rcgel 102 Buchsobe a Ziffcr ii und iii vorgcschenen Fallen'Angabe der leoicn Lebensi^igkeitspnihing. 
Zuffcffcndes ankreuzen. 

Ausftlllen. wcnn die Angabcn bcanuagi worden sind und wenn die Ergebnisse der Prtfung negauv waren. 
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BUOAPESTTT^^VIERT^C UB^DIH l^RNATIONAl '* 
.NERXENNUNG D^^lJIf^TERLECUNO VON M3KRCX)R£2v .Sfi^ 



r>rrERNAT10NAL£S FORMBLATT 



Hoechst Maricn Roussel 
65326 Frankfurt 



EMPFANCSBESTATICUNG BEI ER5THnsTER2-EGUNC, 
ausKCstetlt ctmaA Regel 7.1 von der unten Bngegeecncn 
IKTERNATIONALEN HJKTBILEOUNCSSTHJLE 



t. KENNZEICKNUNG OES MZKROORGANISMUS 



Vom HINTERIEGER zuseieiltes Bezugszctchen: 
A 3/2 



Von dcf INTERNATTGNALEN HINTERLECUNGSSTELLE 
tugctetlte EINGANGSNUMMER: 

DSM 11878 



II. WISSENSCHAFTLICHE BESCHREIBUNC UND/ODER VORCESCHLAGENE TAXONOMISCHE BE2E1CHNUNG 



Mil dcm unier I. bezetcnneicn Mik/uorganismus wurde 

( ) cine vrissenschaAliche Beschitibinif 
(X ) eine verseschtsscne tasonombehe Bezeichming 

emgereicht 

fZuoeifenees inxreuzen). 



tit EINGANG UNO ANNAKME 



Diese intemattonaie HintcnegunguteUe nimmi den unier 1 bezeicAneten MitToorganuinus aaderbeiihrani 1997-11-28 (Duum der 
Enthiniertegung;- eingegangen isl 



IV, EINGANG DES ANTRAGS AUF UMWANDLUNC 



Ocr dfuer I bczetcfmete Milooorcanismiis ist bei dteser Intemtuoniien HititertegungisieUc am eiRgcgangen (Danun der £ni- 
hmtettegung) und cm Antrag auf Umwandlung dieser Enthmttrlcgung m cmc Hiniettcgung gcmftfl Budapester Vemg in am 
tmgegangcn iDatum des Eingangs dea Anmgs auf Umvrandhmg). 



V. ITTTERNATIONAI-E HINTERLECUNGSSmLE 



Name: DSNC -DEUTSCHE SaMMLUNG VON 

MIKR00RCAN15MEN UND ZELLKULTUREN GmbH 

Aiuchfift Ntascneroder Weg lb 
DOS 124 Braunschweig 



Unsrsctiriftfen^ der zur Venretung der mtemauonalcn HtnterlegungssteUe 
behigten ferscmeni oder dcs (der) von thr ermacAOgten Bediensteten: 



Danim; 1997-12-02 



' Falb Resei 6.4 Bucnstaoc d zutriilt isi dies oer ZeuounKL zu aem uer iutus cmer mtemsEionaten Hintenegunguteiie erworocn worden isl 
Fomiblas DSMZ-0P.'4 i etnzige Sciie> 0 1 96 



BNSDOCJD: <WO ^9931244A1_L> 



BUDAPESTER.VHRTRAG UBEJLDIE INTERNATIONALE 
VERKENNUNC DER HI>rERL£CUNC VDN WKROOROlU ^* 
FUR DIE AVrtLO^E VON PAT E>TV tRT/ KREN ' 



INTERNATIONALES FORMBLATT 



Hoechst Maricn Roussel 




65926 Frankfurt 


EMPFANGSBESTATIGUNC BEI ERSTWNTERLEGUNG. 
ausfcstelit tcmaB Rcgel 7.1 von der unten angegeoenen 
IKTERNATIONALEN KINTERL£CUNGSSTEll£ 


1. KENNZEICKNUNC DES MIKROORCANISMUS 


Vom HTNTERLECER zuseteiltes Bczugsztichen: 
A 3/2 


Von dcf INTERNATIONALEN HINTERLEGUNGSSTELLZ 
zugeteiite EINGANGSNTJMIwfER: 

DSM' 11878 


II. WISSENSCHAFTUCHE BESCHREIBUNG UND/ODER VORGESCHLAGENE TAXONOMISCHE BEZHCHNUNG 


Mit dem unier I. bezeichneten MikroorganBinus wurde 




( ) cine wissenschaftliche Bodutibung 

(X ) erne vorgeschla^ene caxonomische Bezeiehnung 




eingcretehL 

(ZuociTcndes ankxvuzen). 




10. EINGANG UNO ANNAHME 


Dtese imematton&le Hinierte^ngsstelte nifximc den unter 1 faezeicnneten Mikraorganumus an. der bei ihr am 9 7 * XL * 2 6 (Danim der 
ExsihtnteriegungV etngegangen isL 



IV. EINGANG DES ANTKACS AUF UMWANDLUNG 



Der unter I bczetchnete Mikroorganismus ist bet dteser Intemaiionalen Hinteriegungsstelle am eingcgangen (Datum der Ent* 
htnterlegung) und cm Anng auf Umwandlung dieser Ersthinterlegung tn eine Hintertegung gemefl Budapesier Vemg in am 
cingegangcn (Danim dei Etngangs des Antrags auf Umwandlung). 



V. INTTRNATIONALE HINTERLEGUNGSSTELLE 



Name: DSMZ-DEUTSCHE SAMMLUNC VON 

MIKROORCANISMEN UND ZELLKULTUREN GmbH 

Araehrift: Maseheroder Weg lb 
D-38134 Braunschweig 



' Falls Resei 6.4 Bucnscaoe o zutritIL ist dies der Zcuduhkl zu oem der Status emer tniemauonaien Hinienegungssteilc erworcen worden tSL 
Fofmblaa DSMZ-BP/4 leinzige Scite) 0196 



UnterschrifUen) der zur Venremng der tniemauonaien Htnieriegungsstelie 
befugien Persomen) oder des (dcr> von ihr ermachsgten BediensKien: 

Daaim: 1997-12-02 



BNSDOCID: <WQ 9931 244 A1 I > 



BUOAPESTER VERTTUC UBER DIE IKTCRNATtONALE 
VERKEMNUNG DER HI>rrERL£CUNC VON MIKROORCA? MEN 
FUR DIE Z^VECK£ VON PATE^^VERf AHREN 



rNTERNATIONALES FORMBLATT 



Hoechst Marion Roiissel 




65926 Frankfurt 


EMPFANGSBESTATIGUNG BEI ER5THINTERIEGUNG. 
ausgestetit etmafl Regel 7.1 von der unicn angegebencn 
INTERNATIONALEN HINTERLECUNGSSTELLE 


1. KEKNZEICHNUNG DES MIKROORGANISMUS 


Vom HIKTERLEGER zusetetiiu Bezugszeichen: 

A 3/2 


Von dcr nsfTERNATIONALEN HINTERLECUNGSSTELLE 
tugetetiie EINGANCSNUMMER: 

DSM- 11878 


II. WISSENSCHATTUCHE BESCHREIBUNG UND/ODER VORCESCHLj\GENE TAXONONflSCHE BEZEICHNUNG 


Mit dem unier I. bezeichncten Mikroorganismus wurde 




( ) eine wissenschaftliche Bcschxtibung 

(X ) eine vorgesehtascne laxonomische Bezeichnung 




eingmichL 

(Zuircrfendcs anicreuzen). 




in. EINGANG UNO ANNAHME 


Dlese mtemuionaie Htmenegungssietle ntmim oen unter ( bezetchneien MttToorgantsmus an. dcr bei ihr am 1 9 97 - IX - 2 8 (Datum der 
Endiintenegung)' etngegangen tsL 



IV. EINGANG DES AKTRACS AUF UMWANDLUNG 



Dcr unter i bezetchncic Miknx)rsanisfnus tsi bei diner intemauonaien Hinicrtegungssieile am etngegangen (Danim der Erst- 
hinienegung) und ein Anng auf Umwandlung dieser Ersthtntenegung m cine Hinterlegung gemafl Budapester Vcmg ist am 
etngegangen (Daxum des Eingangs des Anoags auf Umwandlung). 



V. imERNATlONALE HZNTERLEGUNGSSTEULE 



Name: DSMZ-DEUTSCHE SAiMMLUNG VON 

MIKROORGANISMEN UND ZELLKL'LTUREN GmbH 

Anschrift: Maschcroder Weg tb 
D-3SI24 Braunscnweig 



* Fails React 6.4 Bucnstaec d zutrttlt ist oics ocr Zeitounia. zu oem der Status einer tntemauonatcn Hmtertegungssteitc erworoen women isl 
Forninias DSMZ-BP/4 (etnzige Scitei 0196 



UnterschriAfen) dcr zur Venrctung der intemationaien Hintertegungssielle 
befugten Personicni oaer des (der) von ihr emiaclmgien fiediensieien: 

Oamm: 1997-12-02 



BNSDOCID: <WO 9931244A1_I_> 



INTERNATIONAL SEARCH REPORT 



tm itlonal Application No 

PCT/EP 98/07971 



A. CLASSIFICATION OF SUBJECT MATTER 

IPC 6 C12N15/31 C12N15/52 C12N15/52 C12N15/80 C12N15/81 
C12N1/15 C12N1/19 C07K14/37 //C12R1/75 

According to International Patent Classification (IPC) or to both national cJassitication and IPC 



B. FIELDS SEARCHED 



Minimum aocumentatron searched (classification system toUowed by classdication symdots) 

IPC 6 C07K C12N 



Documentation searched other than minimum documentation to the extent that such documents are included in the fields searched 



Electronic data base consulted durirvg the international search (name ot data base and. where practical, search terms used) 



C DOCUMENTS CONSIDERED TO BE RELEVANT 



Category * 



Citation of document, with indication, where appropriate, of the relevant passages 



Relevant to daim No. 



THEN BERGH K. ET AL. : "Identification of 
a major cis-acting DNA element controlling 
the bidirectionally transcribed penicillin 
biosynthesis genes acvA (pcbAB) and IpnA 
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